91肥熟国产老肥熟女,亚洲天堂在线观看视频,国产真实乱婬A片三区高清蜜臀,国产做受91 一片二
 分類: 公司新聞

導(dǎo)讀

?大量數(shù)據(jù)表明,腸道菌群在人類健康和疾病的幾乎所有方面都發(fā)揮極其重要且深遠(yuǎn)的作用。然而,地球上的大量微生物都是“未經(jīng)培養(yǎng)的”,這對(duì)微生物組研究來說是一個(gè)重大挑戰(zhàn)。宏基因組分箱(Metagenomic binning)是一種將宏基因組測(cè)序得到的混合了不同生物的序列或contigs按物種起源和類別分開歸類的生物信息學(xué)分析方法,提供了一種不依賴培養(yǎng)的方法來克服各種自然生態(tài)位中“未培養(yǎng)的大多數(shù)”缺乏參考基因組的問題。

2023年1月5日,內(nèi)蒙古農(nóng)學(xué)大學(xué)張和平教授和孫志宏研究員團(tuán)隊(duì)在微生物領(lǐng)域國(guó)際期刊《Nature Microbiology》(IF:30.964)上發(fā)表了題為“A high-quality genome compendium of the human gut microbiome of Inner Mongolians(“內(nèi)蒙古人腸道菌群的高質(zhì)量基因組簡(jiǎn)編”)的研究論文。該研究基于一項(xiàng)益生菌(Probio-M8)發(fā)酵乳人群干預(yù)實(shí)驗(yàn),采用混合長(zhǎng)讀(ONT)和短讀HiSeq測(cè)序來表征60名內(nèi)蒙古人的糞便菌群,基于分箱的宏基因組分析策略和方法,構(gòu)建了內(nèi)蒙古人腸道高質(zhì)量基因組數(shù)據(jù)庫(kù)(IMGG)。百邁客為該研究提供了ONT宏基因組測(cè)序服務(wù)。

主要結(jié)果

1、超深度宏基因組混合測(cè)序與組裝

研究者利用了之前進(jìn)行的一項(xiàng)基于生物標(biāo)記物的縱向人體試驗(yàn),該試驗(yàn)調(diào)查了每天攝入益生菌酸奶(包含Bifidobacterium lactis?ProBio-M8,ProBio-M8)與普通酸奶相比的益處。隨機(jī)挑選了60名參與者在三個(gè)時(shí)間點(diǎn)(開始食用酸奶后0、7和28d)采集了180份糞便樣本,在PromethION 和HiSeq平臺(tái)上進(jìn)行了超深度測(cè)序,生成了3.7Tbps的三代數(shù)據(jù)和20.1Tbps的二代數(shù)據(jù)(即每個(gè)樣本20.5±4.5 Gbps和111.8±8.65 Gbps)。該混合超深宏基因組測(cè)序?qū)崿F(xiàn)了平均N50長(zhǎng)度為278Kbps宏基因組組裝,平均總組裝長(zhǎng)度為314Mbps。*長(zhǎng)contig為6.77 Mbps,6688個(gè)contig大于1 Mbps。三代數(shù)據(jù)的質(zhì)量遠(yuǎn)遠(yuǎn)超過了大多數(shù)現(xiàn)有的人類腸道三代數(shù)據(jù)庫(kù),目前的三代數(shù)據(jù)庫(kù)中平均N50長(zhǎng)度為8Kbps;平均reads長(zhǎng)度為6 Kbps;平均reads質(zhì)量為9.5。

為了評(píng)估組裝流程的準(zhǔn)確性,研究者基于三種測(cè)序和組裝策略,直接從攝入益生菌酸奶的個(gè)體糞便樣本中組裝Probio-M8基因組:即僅三代序列組裝、二三代混合組裝、僅二代序列組裝。對(duì)于每種組裝方法,分別重建了50個(gè)Probio-M8基因組,并與Probio-M8參考基因組進(jìn)行比較。和預(yù)期一致,與單獨(dú)使用二代或三代測(cè)序構(gòu)建的基因組相比,二三代混合組裝的基因組在組裝連續(xù)性、堿基對(duì)和基因預(yù)測(cè)準(zhǔn)確性、基因組完整性、全基因組相似性度量以及功能注釋的精準(zhǔn)度等多個(gè)基因組質(zhì)量參數(shù)方面表現(xiàn)出了極大的提高 。此外,二三代混合組裝的基因組組裝錯(cuò)誤率與二代數(shù)據(jù)覆蓋率呈負(fù)相關(guān),但與測(cè)序深度無關(guān)。因此,二三代混合組裝是一種強(qiáng)有力的策略,可以直接從復(fù)雜的人類腸道宏基因組數(shù)據(jù)庫(kù)組裝環(huán)狀和更加準(zhǔn)確的基因組。

2、高效組裝種水平的CMAG

基于二三代測(cè)序混合組裝共獲得了802個(gè)CMAG,在準(zhǔn)備本手稿時(shí),只有225個(gè)CMAG保存在公共基因組數(shù)據(jù)庫(kù)中。其中大多數(shù)(n=160)是從環(huán)境元基因組中重建的。該研究組裝的CMAG較大,從1.0 Mbps到5.5 Mbps(平均為2.4 Mbps),這個(gè)范圍涵蓋了大多數(shù)已知腸道細(xì)菌的基因組大小。為了評(píng)估目前組裝的CMAG的代表性,按照平均核苷酸同源性(ANI)95%閾值進(jìn)行物種水平基因組去冗余,然后將該數(shù)據(jù)集與統(tǒng)一人類胃腸道基因組(UHGG)中去復(fù)制的基因組進(jìn)行比較??偣脖A袅?34個(gè)種水平的CMAG,涵蓋11個(gè)門、14個(gè)綱、27個(gè)目、45個(gè)科、94個(gè)屬(圖1A和補(bǔ)充表5)。其中有131個(gè)物種水平的CMAG是之前未報(bào)道的環(huán)狀的、完整、人類特有的各自物種的代表性基因組,65個(gè)未培養(yǎng)物種的參考基因組的質(zhì)量得到了改善。這些結(jié)果表明了當(dāng)前工作流程在從復(fù)雜的宏基因組數(shù)據(jù)集和組裝挑戰(zhàn)的區(qū)域組裝完整基因組方面的能力和有效性。

圖1.有效組裝大量物種水平的完整(環(huán)狀,無間隙)宏基因組組裝基因組

3、內(nèi)蒙古人高質(zhì)量腸道基因組數(shù)據(jù)庫(kù)

最初的bins是通過兩種裝箱方法(MetaBAT23和Vamb11)產(chǎn)生的,然后通過DASTool和內(nèi)部腳本進(jìn)行整合和改進(jìn)。連同上述CMAG,該研究總共還原了12,391個(gè)符合MIMAG標(biāo)準(zhǔn)中的中位質(zhì)量標(biāo)準(zhǔn)的MAG(>50%完整性和<5%污染)。其中的6,729個(gè)MAG也滿足MIMAG標(biāo)準(zhǔn)高質(zhì)量定義(完整性>90%和污染率<5%,具有5S、16S和23S rRNA基因以及至少18個(gè)tRNA(TRNA)基因;稱為IMGG數(shù)據(jù)集)。

接下來,研究者對(duì)IMGG數(shù)據(jù)集中的6,729個(gè)MAG和從UHGG收集檢索到的147,835個(gè)高質(zhì)量基因組進(jìn)行聚類分析(圖2A)。聚類過程產(chǎn)生了485個(gè)宏基因組種(MGS),其中至少包含一個(gè)IMGG。從分類上劃分為11個(gè)門、14個(gè)綱、30個(gè)目、40個(gè)科,橫跨220個(gè)屬(圖2B和補(bǔ)充表8)。

工作流程顯著提升了MAG的連續(xù)性(圖2C),這從IMGG數(shù)據(jù)集中的contig數(shù)量顯著少于UHGG數(shù)據(jù)集中的N50長(zhǎng)度或代表性基因組(重疊群數(shù)量;N50長(zhǎng)度。此外,盡管UHGG數(shù)據(jù)集包含相當(dāng)多的MAG(n=111,744),但只有5,053個(gè)MAG符合MIMAG標(biāo)準(zhǔn)中規(guī)定的高質(zhì)量標(biāo)準(zhǔn),而且其中大多數(shù)(n=4,058)是培養(yǎng)的分離物,這表明基因組質(zhì)量需要進(jìn)一步完善。另一方面,該研究為288個(gè)物種提供了具有代表性的高質(zhì)量MIMAG參考基因組,可用高質(zhì)量MIMAG的數(shù)量在154個(gè)物種中擴(kuò)大了50%以上,其中包括一些在UHGG目錄中具有較高代表性的物種,如Agathobacter rectalis、Alistipes putredinis、Bacteroides_B dorei和Lachnospira eligens_B(圖2D和補(bǔ)充表8)。

圖2.內(nèi)蒙古人腸道基因組IMGG數(shù)據(jù)庫(kù)是一個(gè)擴(kuò)展的基因組資源

4、提高腸道復(fù)雜基因組區(qū)域的分辨率

為了揭開復(fù)雜的腸道基因組區(qū)域(包括rrn、MGC、前噬菌體和IS),該研究將從IMGG數(shù)據(jù)庫(kù)組裝的485個(gè)MGS與UHGG數(shù)據(jù)庫(kù)中的對(duì)應(yīng)片段進(jìn)行了比較。正如預(yù)期一樣,與UHGG相比,IMGG有著更多的rrn拷貝(包括16S、23S和5S rRNA)(圖3a);并且IMGG和NCBI基因組數(shù)據(jù)庫(kù)中對(duì)應(yīng)的完整分離基因組的rrn拷貝數(shù)基本一致,這表明UHGG數(shù)據(jù)庫(kù)中MGS嚴(yán)重低估了的rrn基因拷貝數(shù)。此外,通過對(duì)全面的基因拷貝數(shù)數(shù)據(jù)庫(kù)(rrnDB)進(jìn)行分類搜索,其中85%(413/485)在當(dāng)前組裝的MGS是找不到的,包括一些16S基因拷貝數(shù)高的未培養(yǎng)MGS。這些結(jié)果表明,由于基因組質(zhì)量不足,目前可用的基因拷貝數(shù)參考數(shù)據(jù)庫(kù)在很大程度上仍然不完整。

研究者進(jìn)一步使用MGC預(yù)測(cè)工具gutSMASH,比較了IMGG和UHGG中MGC的完整度。結(jié)果表明,在UHGG中發(fā)現(xiàn)的mGCs有很大比例(56.5%)位于contig邊緣,可能是不完整的,而在IMGG中只有4.5%的比例較低(圖3B)。此外,在IMGG和UHGG數(shù)據(jù)集中分別發(fā)現(xiàn)了每個(gè)基因組具有6個(gè)和3個(gè)完整的MGC,這表明在IMGG中識(shí)別全長(zhǎng)MGC方面有了實(shí)質(zhì)性的改進(jìn)(圖3B)。包含MGC編碼序列的基因組比例在IMGG中顯著高于UHGG(圖3C),特別是在幾個(gè)MGC類別中,包括非蛋白源氨基酸、芳香族和其它短鏈脂肪酸(圖3D)。值得注意的是,MGC區(qū)的基因組比例只與短讀基因組的組裝N50長(zhǎng)度有關(guān),而與IMGGs無關(guān),這表明MGC識(shí)別和分配的有效性和分辨率受到短讀數(shù)據(jù)組裝連續(xù)性不足的限制。

與UHGG數(shù)據(jù)庫(kù)相比,IMGG數(shù)據(jù)庫(kù)中前噬菌體基因組的分辨率有了很大提升。該方法在95%的IMGG中都能檢測(cè)到前噬菌體序列(與UHGG(55%)相比)。IMGG和UHGG每個(gè)基因組編碼前噬菌體的平均數(shù)量分別為4個(gè)和1個(gè)。IMGG中的前噬菌體序列的連續(xù)性也較高,N50長(zhǎng)度為37974 bp(UHGG中為31064 bp;圖3f);IMGG中前噬菌體編碼區(qū)的基因組比例是UHGG的4.2倍(圖3g)。與UHGG相比,IMGG中的IS區(qū)域更加jing q,表現(xiàn)在在每個(gè)物種的IS區(qū)域總拷貝數(shù)(增加了三倍;圖3h)和IS編碼區(qū)域的基因組比例(增加了近四倍;圖3i)。IS類別中改善程度*高的是IS1380(與UHGG相比,改善了5.6倍),其次是IS5、IS1634和ISAS1(分別是5.5倍、5.5倍和5.3倍;圖3j)。

圖3.內(nèi)蒙古人腸道基因組增強(qiáng)遺傳元件的基因組分辨率

5、人類腸道微生物中高度多樣化和分化的 MGC

進(jìn)一步深入探索了可用的高質(zhì)量基因組中編碼的代謝潛力。分析了 UHGG 和 IMGG 數(shù)據(jù)集中的高連續(xù)性和高質(zhì)量基因組。共從15512個(gè)基因組中還原了97428個(gè)MGC區(qū)域,其中78675個(gè)是完整的,并被納入進(jìn)一步分析。這些完整的MGC屬于所有八個(gè)MGC類別,分布在58個(gè)MGC類型中。*常見的類別是SCFA(40.0%),其次是Putative(28.9%)和E-MGC(17.2%)。然后,門水平分布和聚類分析揭示了MGC類別的總體分布在門水平的顯著差異(圖4a),以及在十個(gè)主要的門之間,它們?cè)诓煌T中的數(shù)量各不同(圖4a)。此外,基于涵蓋九個(gè)主要門的功能性MGC分類分布的特異性聚類表明,MGC概述和組成在門水平間存在顯著差異,這些未培養(yǎng)物種中的一些最近發(fā)現(xiàn)了以前未報(bào)告的Christensenellales和Oscillospirales分類群,突出了這些代表性不足的分類群在促進(jìn)宿主健康方面的潛力(圖4c)。

約12%的MGC具有多個(gè)核心功能域。混合MGC顯著大于單一功能域MGC(P<2×10?16;擴(kuò)展數(shù)據(jù)圖4A)。普遍的混合MGC組合是丁二酸酯和紅細(xì)菌固氮(RNF)復(fù)合體。大的混合MGC大小為117Kbps。它含有5個(gè)MGC功能結(jié)構(gòu)域,其中兩個(gè)屬于E-MGC和SCFA-其他類(分別屬于RNF復(fù)合體和乙醇胺利用途徑),占MGC總長(zhǎng)度的80%以上。這些數(shù)據(jù)表明,腸道微生物組MGC編碼了廣泛的代謝潛力,不同關(guān)鍵的人類腸道分類群的代謝潛力差異很大。這項(xiàng)研究為系統(tǒng)揭示人類腸道代謝潛能提供了起點(diǎn)。

圖4 人腸道菌群中代謝基因簇庫(kù)概述

6、2834個(gè)腸道前噬菌體的分類和功能注釋

噬菌體是另一組被低估的腸道微生物群。因此,研究者進(jìn)一步挖掘了 IMGG 數(shù)據(jù)集以尋找未知的腸道噬菌體。從 IMGG 數(shù)據(jù)集中還原了總共 21,217 個(gè)前噬菌體基因組,通過應(yīng)用未培養(yǎng)病毒基因組 (MIUViG) *低信息標(biāo)準(zhǔn),進(jìn)一步聚類為 13,437 個(gè)物種水平病毒操作分類單元(vOTUs)。這些 vOTU 代表 39,839 Kbps N50 長(zhǎng)度。

通過與宏基因組腸道病毒(MGV)數(shù)據(jù)庫(kù)進(jìn)行比較,對(duì)vOTU進(jìn)行分類。值得注意的是,95.5%(n=12834)的vOTU與MGV數(shù)據(jù)庫(kù)在物種水平不具有同源性。除了那些可分類到物種水平(4.5%)的病毒外,90.9%的vOTU與MGV水平具有科水平的同源性,但只有46.7%的病毒被分類到已知的病毒科(圖5a)。進(jìn)一步分析表明,常見的細(xì)菌宿主是Firmicutes_A(71.4%),這也是先前未報(bào)告前噬菌體的主要宿主。Siphoviridae和Myoviridate都是人類腸道中的優(yōu)勢(shì)前噬菌體科,其宿主范圍廣泛,涵蓋多個(gè)門(圖5c);然而,Siphoviridae(Firmicutes_A [68.8%],Bacteroidota [15.58%],Actinobacteriota [5.3%])和Myoviridae [Firmicuters_A[83.0%])的主要細(xì)菌宿主在門水平的分布卻有很大差異。如預(yù)期那樣,crAssphage的宿主范圍小且具有特異性,僅由擬桿菌屬組成。

接下來,對(duì)IMGG數(shù)據(jù)庫(kù)中的前噬菌體基因組進(jìn)行深入分析,以探究其功能能力。從12834個(gè)物種水平的vOTU代表性基因組中鑒定出596193個(gè)蛋白質(zhì)編碼基因,并將這些假定基因與幾個(gè)常見的功能和/或病毒注釋數(shù)據(jù)庫(kù)進(jìn)行了比較。結(jié)果表明,僅有55.4%的前噬菌體基因在功能上能夠被分類,而44.6%的基因與任何交叉比較的數(shù)據(jù)庫(kù)都不具有同源性,被分配給了未知的功能(圖5d)。這些結(jié)果表明,盡管攜帶ARG的噬菌體很少存在于腸道微生物中,但這些噬菌體可能編碼ARG(例如,A163.CMAG_1_1_7_59800編碼假定的β-內(nèi)酰胺酶基因;圖5h),可能成為ARG轉(zhuǎn)移的關(guān)鍵載體,并對(duì)人類健康造成嚴(yán)重威脅。這些結(jié)果表明,腸道前噬菌體在分類和功能上比先前我們所了解的更加多樣化。

圖5 腸道中前噬菌體和插入序列的概述

總 結(jié)

在該項(xiàng)研究中,使用混合長(zhǎng)讀長(zhǎng) PromethION 和短讀長(zhǎng) HiSeq 測(cè)序?qū)?60 名內(nèi)蒙古人(三個(gè)時(shí)間點(diǎn), 180 個(gè)樣本)的糞便微生物群進(jìn)行了表征。構(gòu)建了 IMGG 數(shù)據(jù)庫(kù),其中包含 802 個(gè)環(huán)狀基因組和 5,927 個(gè)符合 MIMAG 標(biāo)準(zhǔn)中規(guī)定的高質(zhì)量基因組標(biāo)準(zhǔn)的高質(zhì)量基因組,極大地?cái)U(kuò)展了當(dāng)前人類腸道高質(zhì)量 MIMAG 數(shù)據(jù)庫(kù)(n = 7,492)。此外,該 CMAG 基因組數(shù)據(jù)集,是目前可用 CMAG 的三倍多。因此該研究構(gòu)建的IMGG 數(shù)據(jù)庫(kù)是一個(gè)有價(jià)值的基因組資源。

內(nèi)蒙古農(nóng)學(xué)大學(xué)張和平教授和孫志宏研究員為該論文通訊作者,第一作者為食品科學(xué)與工程學(xué)院2018級(jí)博士研究生靳昊,2022級(jí)博士研究生全柯諭何秋雯助理研究員為共同第一作者。

參考文獻(xiàn)

Jin H, Quan K, He Q, et al. A high-quality genome compendium of the human gut microbiome of Inner Mongolians. Nat Microbiol. 2023;8(1):150-161. doi:10.1038/s41564-022-01270-1

最近文章