百邁客一直秉承“生物科技長(zhǎng)信,服務(wù)社會(huì),造福人民”的企業(yè)使命,致力于讓生物科技更快,更好的提高人類生活質(zhì)量。通過(guò)整合高通量測(cè)序技術(shù)、生物信息技術(shù)與云計(jì)算、大數(shù)據(jù)等新興IT技術(shù),為用戶開(kāi)啟生物科技服務(wù)2.0新時(shí)代。各種測(cè)序的經(jīng)驗(yàn)也都是十分豐富,今天給大家?guī)?lái)一篇結(jié)直腸癌對(duì)腸道微生物群菌群落結(jié)構(gòu)的影響研究報(bào)道,了解應(yīng)用的新方向。詳解見(jiàn)下文:
摘要
背景: 結(jié)直腸癌是全球癌癥相關(guān)死亡的主要原因。想要了解結(jié)直腸癌的發(fā)生、發(fā)展和治療,人類腸道微生物菌群是一個(gè)熱門的研究領(lǐng)域。多項(xiàng)研究發(fā)現(xiàn)結(jié)直腸癌患者的腸道微生物群中特定細(xì)菌豐度與健康人群相比有顯著性變化,但是還沒(méi)有明確哪沒(méi)有一種細(xì)菌與所有病例相關(guān)。目前還不清楚這種變化與癌變的因果關(guān)系,但重點(diǎn)應(yīng)放在解釋與癌癥相關(guān)的腸道微生物群落結(jié)構(gòu)變化上。
結(jié)果:通過(guò)對(duì)先前發(fā)表的252份來(lái)自健康和晚期結(jié)直腸癌患者的全基因組測(cè)序糞便樣本進(jìn)行新的分析,我們確定了癌癥相關(guān)人類腸道微生物菌群的分類、功能和結(jié)構(gòu)變化。根據(jù)這些數(shù)據(jù)分析揭示了健康的腸道微生物菌群和結(jié)直腸癌相關(guān)腸道微生物菌群之間潛在的微生物群落結(jié)構(gòu)變化的顯著差異。發(fā)現(xiàn)在分類學(xué)上和功能上與癌癥相關(guān)的細(xì)菌與其他細(xì)菌形成關(guān)聯(lián),并且在功能上形成適應(yīng)于與腫瘤相關(guān)的生態(tài)系統(tǒng)中的潛在變化的模塊。通過(guò)對(duì)這些樣本進(jìn)行的微生物群落分析得到,與癌癥相關(guān)細(xì)菌的物種多樣性顯著增加,被歸類為源自口腔微生物菌群的物種相對(duì)豐度增加,包括Fusobacterium nucleatum, Peptostreptococcus stomatis, Gemella morbillorum還有Parvimonas micra等。分析群落功能的差異豐度后得出,與毒力因子和肽降解相關(guān)的功能表達(dá)增加,與結(jié)腸直腸癌腸道微生物菌群內(nèi)氨基酸生物合成相關(guān)的功能表達(dá)減少。
結(jié)論:我們通過(guò)對(duì)大量晚期結(jié)直腸癌患者和健康受試者得到的全基因組測(cè)序糞便樣本,分析出結(jié)直腸癌相關(guān)腸道微生物菌群中發(fā)生的許多潛在的重要分類、功能和結(jié)構(gòu)改變。分析表明,癌癥影響腸道微生物菌群中細(xì)菌的組成,一些特殊的口腔菌群及其相關(guān)菌群可能與腫瘤的發(fā)生有關(guān)。
實(shí)驗(yàn)方法
材料:178位健康人(男女比例56.18/43.82)和74位晚期(52位三期/ 22位四期,男女比例58.11/41.89)結(jié)直腸癌患者的糞便樣本
方法:宏基因組測(cè)序,統(tǒng)計(jì)分析
研究方法
細(xì)菌群落分類學(xué)分析
使用基于em的方法計(jì)算每個(gè)樣本內(nèi)物種的相對(duì)豐度,以構(gòu)建一個(gè)樣本分類單元矩陣,通過(guò)測(cè)量每個(gè)樣本的細(xì)菌豐富度和Shannon指數(shù),利用該矩陣探究?jī)蓚€(gè)樣本組(健康和晚期CRC)的微生物多樣性。CRC組的樣本顯示出更大的多樣性,包括豐富度和Shannon指數(shù)(Mann-Whitney U檢驗(yàn):MWU);豐富度:MWU pvalue = 0.0005, Shannon指數(shù):MWU pvalue = 0.0009)(圖一a,b)。由于物種多樣性的量度對(duì)物種均勻度和豐富度的敏感性不同,還應(yīng)用了辛普森指數(shù)來(lái)計(jì)算樣本組內(nèi)的物種多樣性,這些結(jié)果與之前的分析一致,CRC樣本中的物種多樣性與健康樣本中的物種多樣性有顯著性差異(MWU值= 0.0238).
評(píng)估健康和晚期結(jié)直腸癌相關(guān)腸道微生物群之間的細(xì)菌群落分類特征差異。對(duì)樣本分類群矩陣進(jìn)行CLR轉(zhuǎn)換,使用主成分分析進(jìn)行基于分類剖面的樣本排序。前兩個(gè)主成分只能解釋總方差的一小部分(PC1: 7.98%,PC2: 5.61%),基于主成分分析的線性變換未顯示健康樣本與CRC樣本有差異,但通過(guò)隨機(jī)森林分類器(RFC)可以區(qū)分兩個(gè)樣本組(AUC = 0.87)(圖 2a)。雖然RFC根據(jù)重要性對(duì)物種進(jìn)行排序,但這些默認(rèn)度量是有一定偏差。為獲得RFC提供的物種重要度的統(tǒng)計(jì)顯著性,在我特征集中包含一個(gè)“隨機(jī)”特征。通過(guò)使用100個(gè)RFC的集合,發(fā)現(xiàn)了17種細(xì)菌,在這些顯著“重要”物種上訓(xùn)練的100個(gè)RFC的準(zhǔn)確性分類得分大于在所有物種上訓(xùn)練的100個(gè)RFC的準(zhǔn)確性分類得分(所有物種平均準(zhǔn)確性為74%;17個(gè)非?!爸匾钡奈锓N平均準(zhǔn)確率為80%(圖 2c)。物種差異豐度分析顯示,與健康腸道微生物組相比,CRC相關(guān)腸道微生物組中有174個(gè)物種的相對(duì)豐度顯著降低,10個(gè)物種的相對(duì)豐度顯著升高。這174個(gè)細(xì)菌物種分別來(lái)自84個(gè)屬,大多數(shù)來(lái)自 Enterobacter(6.8%), Klebsiella(6.3%), Streptococcus(5.2%), Lactobacillus (5.1%), Citrobacter(4.6%), Bifidobacterium(4%),Bacteroides(3.4%),以及 Clostridium(3.4%)。CRC中相對(duì)豐度顯著升高的10個(gè)物種是 Parvimonas micra(qvalue = 3.09e-09), Peptostreptococcus stomatis(qvalue = 4.51e-08), Gemella morbillorum(qvalue = 4.55e-08), Fusobacterium nucleatum(qvalue = 1.08e-06), Streptococcus anginosus(qvalue = 1.13e-03), Dialister pneumosintes (qvalue=1.37e-03),Peptostreptococcus anaerobius (qvalue=4.74e-03), Streptococcus sp. KCOM 2412(Streptococcus periodonticum)(qvalue = 7.18e-03), Ruminococcus torques(qvalue = 1.55e-02),以及ilifactor alocis(qvalue = 2.85e-02)。
有趣的是,許多在CRC中被認(rèn)為非常“重要”且相對(duì)豐度較高的物種也存在于口腔微生物組中,也與部分口腔疾病(牙周炎、根尖周病變、根管感染、口腔癌等)、CRC風(fēng)險(xiǎn)的增加有關(guān)。隨后,我們通過(guò)人類口腔微生物數(shù)據(jù)庫(kù)(eHOMD)對(duì)我們樣本中的所有口腔物種進(jìn)行分類,發(fā)現(xiàn)與健康組相比,CRC相關(guān)腸道微生物組內(nèi)存在的總口腔微生物種群豐富度顯著增加(MWU: pvalue = 6.51e-05)(圖2 d)。

圖1
圖2
細(xì)菌群落功能分析
為分析健康的腸道微生物群落功能和結(jié)直腸癌腸道微生物群落功能的差異,還有蛋白質(zhì)家族特點(diǎn)(TIGRFAMs)和蛋白質(zhì)結(jié)構(gòu)域(Pfams)。主成分分析解釋了樣本組間聚類中等方差分別是PC1: 27.19%、PC2: 4.33%。差異豐度分析顯示12個(gè)Pfams(與健康組相比,CRC升高7個(gè),降低5個(gè))和兩個(gè)TIGRFAMs(與健康組相比,CRC升高1個(gè),降低1個(gè))的相對(duì)豐度具有統(tǒng)計(jì)學(xué)顯著性差異(MWU-FDR: qvalue%3C 0.05)。在結(jié)直腸癌腸道微生物組中顯著升高的Pfams與細(xì)菌侵襲素和粘附素(例如FadA)有關(guān),而顯著降低的Pfams與抗生素抗性、噬菌體成熟和蘇氨酸生物合成有關(guān)。CRC中顯著升高的單一TIGRFAM與脯氨酸亞氨基肽酶相關(guān),而顯著降低的TIGRFAM再次與蘇氨酸生物合成相關(guān)。
細(xì)菌關(guān)聯(lián)網(wǎng)絡(luò)
首先,計(jì)算所有樣本中每種物種的流行率(圖3a),發(fā)現(xiàn)細(xì)菌種類流行計(jì)數(shù)在組內(nèi)的分布呈現(xiàn)雙峰分布,一個(gè)峰值閾值為90%。我們將群體內(nèi)樣本流行率超過(guò)90%的物種稱為高度流行物種(HPS),發(fā)現(xiàn)每一組HPS中的大多數(shù)物種是共享的(健康組:97%,CRC: 95%)(圖3b)。健康組中五個(gè)獨(dú)特的HPS是:Hespellia stercorisuis,Clostridium saccharolyticum,Monoglobus pectinilyticus, Streptococcus sp. oral taxon 431,和Odoribacter laneus。CRC關(guān)聯(lián)組獨(dú)有的八個(gè)HPS:Intestinibacillus massiliensis, Prevotella copri, Haemophilus parainfluenzae, Ruminococcus bicirculans, Streptococcus mitis, Neglecta timonensis, Bifidobacterium catenulatum,和Anaerotignum neopropionicum。Streptococcus mitis和 Haemophilus parainfluenzae都被eHOMD歸類為口腔微生物。發(fā)現(xiàn)HPS的相對(duì)豐度占樣品總相對(duì)豐度82%(圖3c)。除了這些高度普遍和豐富的物種之外,還納入一些被RFC認(rèn)為非常“重要”的物種,并發(fā)現(xiàn)它們的豐度存在差異。增加了8個(gè)物種(arvimonas micra, Peptostreptococcus stomatis, Gemella morbillorum, Fusobacterium nucleatum, Streptococcus anginosus, Dialister pneumosintes, Peptostreptococcus anaerobius, and Ruminococcus torques)到物種群(共165種)的網(wǎng)絡(luò)構(gòu)建中。將多個(gè)網(wǎng)絡(luò)屬性與隨機(jī)網(wǎng)絡(luò)中顯示的屬性進(jìn)行比較來(lái)檢查網(wǎng)絡(luò)的非隨機(jī)性,與隨機(jī)網(wǎng)絡(luò)相比,健康組和CRC都表現(xiàn)出統(tǒng)計(jì)學(xué)顯著(Monte Carlo Simulation; MCS);較短的平均最短路徑長(zhǎng)度(ASPL)(Healthy and CRC: MCS pvalue<?0.001),較高的傳遞性(Healthy and CRC: MCS pvalue<?0.001)和更高的模塊化(Healthy and CRC: MCS pvalue<?0.001)。這些結(jié)果表明,構(gòu)建的網(wǎng)絡(luò)顯示出顯著非隨機(jī)的特性,并且網(wǎng)絡(luò)內(nèi)的物種通過(guò)短路徑彼此連接,與它們的鄰近物種具有積極的關(guān)聯(lián),并且形成模塊(即物種的組或集群),其特征在于在同一模塊內(nèi)的物種之間發(fā)生的關(guān)聯(lián)占大多數(shù),而與模塊外的物種存在的關(guān)聯(lián)很少。
圖3
群體網(wǎng)絡(luò)包含相似的關(guān)聯(lián)權(quán)重分布,正相關(guān)比負(fù)相關(guān)更多(圖4a)。值得注意的是,與健康網(wǎng)絡(luò)相比,CRC包含更多的負(fù)相關(guān)。29%的負(fù)相關(guān)涉及一種被認(rèn)為是口腔微生物的物種,而在健康網(wǎng)絡(luò)中,沒(méi)有發(fā)現(xiàn)涉及口腔菌群。在網(wǎng)絡(luò)中發(fā)現(xiàn)的大多數(shù)關(guān)聯(lián)是該網(wǎng)絡(luò)獨(dú)有的(健康:69%,CRC:72%)(圖4b)。我們假設(shè)群落結(jié)構(gòu)的這種巨大差異可以反映生態(tài)系統(tǒng)的變化,并進(jìn)而分析了網(wǎng)絡(luò)中物種之間的分類關(guān)系(圖4c)。兩個(gè)網(wǎng)絡(luò)在同一屬內(nèi)的物種(健康:MCS pvalue= 0.00099,CRC:MCS pvalue= 0.00099)和家族(健康:MCS值= 0.00099,CRC:MCS= 0.00099 )。然而,只有在健康組的網(wǎng)絡(luò)中,物種與來(lái)自同一順序的其他物種的積極相關(guān)仍然明顯多于隨機(jī)相關(guān)(健康:MCS pvalue= 0.00099,CRC: MCS pvalue = 0.44)。與健康網(wǎng)絡(luò)(健康:4%,CRC:17%)相比,CRC的網(wǎng)絡(luò)在分類上的遠(yuǎn)緣關(guān)系中顯示出更大的豐度,在健康網(wǎng)絡(luò)中分類上的遠(yuǎn)緣微生物之間的正關(guān)聯(lián)仍然顯著較少(門內(nèi):MCS值= 0.00099,門外:MCSp值= 0.00099)和CRC(門內(nèi):MCS pvalue= 0.00099,門外:MCS pvalue= 0.00099)而不是隨機(jī)網(wǎng)絡(luò)。

圖4
通過(guò)構(gòu)建CLR轉(zhuǎn)換的模塊功能來(lái)比較模塊的潛在功能。模塊功能(蛋白域)圖譜的PCA顯示出較大的差異(PC1: 33.73%,PC2: 14.53%),模塊似乎形成包含兩組代表的簇團(tuán)(圖 5a)。為了定義模塊的聚類,進(jìn)行了輪廓分析,估計(jì)五個(gè)聚類作為用于K-均值聚類的最*K值(圖?5b)。通過(guò)K-均值聚類定義模塊聚類后(圖?5c)對(duì)這些集群進(jìn)行了分類分析。在整個(gè)網(wǎng)絡(luò)中,同一集群內(nèi)的模塊被發(fā)現(xiàn)在分類學(xué)上是相似的,不包括簇1和簇5,簇1和簇5顯示出物種占有的變化,其中在健康網(wǎng)絡(luò)的簇1內(nèi)發(fā)現(xiàn)的一些物種被顯示在CRC組的簇5內(nèi)。然而,兩個(gè)網(wǎng)絡(luò)對(duì)在簇2、3和4中發(fā)現(xiàn)的物種有很強(qiáng)的一致性。第2組中的物種僅有“致病菌”(即通常無(wú)害但在特定環(huán)境條件下具有致病能力的物種)口腔微生物,而簇3主要是鏈球菌種和簇4主要類桿菌種。隨后,進(jìn)行聚類功能分析以發(fā)現(xiàn)蛋白質(zhì)結(jié)構(gòu)域,以及蛋白質(zhì)家族的主要作用和次要作用,這使得聚類在功能上不同。簇1的功能與細(xì)胞表面粘附、對(duì)抗沖突策略、酪氨酸重組酶、多糖降解、糖胺聚糖結(jié)合、腫瘤蛋白酶抑制、過(guò)氧化物酶功能、碳水化合物/纖維素結(jié)合活性和氨基酸生物合成相關(guān)。簇2的功能涉及對(duì)宿主細(xì)胞和細(xì)胞外基質(zhì)的粘附、細(xì)胞感染、膠原結(jié)合、補(bǔ)體抗性、鳥(niǎo)氨酸/賴氨酸/精氨酸脫羧酶(組織腐敗/多胺合成/酸性環(huán)境抗性)、金屬肽酶、V型分泌系統(tǒng)、氨的產(chǎn)生和有毒金屬離子的排泄(銅流出系統(tǒng))、細(xì)胞包膜、DNA代謝、脂肪酸和磷脂代謝、表面多糖和脂多糖的生物合成和降解。簇3的功能與粘蛋白結(jié)合、鋅清除/吸收、細(xì)胞表面粘附、葡萄糖結(jié)合/轉(zhuǎn)運(yùn)和銅結(jié)合、蛋白質(zhì)和肽的命運(yùn)/合成/分泌、多糖/碳水化合物、有機(jī)醇和酸的降解方面有關(guān)。簇4的功能涉及金屬結(jié)合、二瓜氨酸環(huán)化酶/磷酸二酯酶、群體感應(yīng)、碳水化合物結(jié)合和半胱氨酸/木瓜蛋白酶、核苷和核苷酸、轉(zhuǎn)運(yùn)和結(jié)合蛋白、TCA循環(huán)、鐵攜帶以及表面多糖的降解和生物合成。最后簇5的區(qū)別功能與氨肽酶、三羧酸受體、乙醇胺轉(zhuǎn)運(yùn)、淀粉利用、木葡聚糖/多糖結(jié)合、能量代謝、氨基酸和胺、陽(yáng)離子和鐵化合物、電子轉(zhuǎn)運(yùn)以及表面多糖和脂多糖的生物合成和降解相關(guān)。檢查了在每個(gè)集群內(nèi)發(fā)現(xiàn)的用于網(wǎng)絡(luò)構(gòu)建的物種的豐度(健康:簇1 (33%)、簇2 (2%)、簇3 (5%)、簇4 (26%)、簇5 (7%)、無(wú)(27%);CRC:簇1 (19%)、簇2 (3%)、簇3 (3%)、簇4 (12%)、簇5 (30%)、無(wú)(33%)(圖6)。我們的發(fā)現(xiàn)表明,與健康組相比,在CRC中,第2類和第5類組模塊中發(fā)現(xiàn)的物種總數(shù)增加,第1類、第3類和第4類組中發(fā)現(xiàn)的物種減少。這些結(jié)果也反映在我們發(fā)現(xiàn)的總樣本相對(duì)豐度的統(tǒng)計(jì)顯著變化中,即群內(nèi)物種在群間所占的比例(第一組: MWU值= 4.29 e-12;第二組:MWU值= 3.16 e-16;第三組:MWU值= 0.0002;第四組:MWU值= 2.62-13;第五組:MWUp值= 2.81 e-29;無(wú)集群物種:MWU值= 4.40-17(圖7)。此外,發(fā)現(xiàn)網(wǎng)絡(luò)內(nèi)的大多數(shù)負(fù)面關(guān)聯(lián)(健康:100%,CRC:96%)發(fā)生在占據(jù)不同集群類型內(nèi)模塊的物種之間。只有在CRC中,簇1的物種之間才出現(xiàn)集群內(nèi)的負(fù)相關(guān),其中物種種類和豐度也顯示出減少。

圖5

圖6
