2024年11月14日,北京大學(xué)現(xiàn)代農(nóng)業(yè)研究院郭立研究員團(tuán)隊(duì)的本氏煙草完整基因組研究成果以“The complete genome assembly of?Nicotiana benthamiana?reveals the genetic and epigenetic landscape of centromeres”為題,在國(guó)際著名期刊Nature Plants上在線發(fā)表。
文章通過(guò)構(gòu)建本氏煙草端粒到端粒無(wú)缺口基因組,對(duì)本氏煙草進(jìn)行了亞基因組分型,進(jìn)一步確定林煙草(N. sylvestris)和漸狹葉煙草(N. attenuata)最可能是其二倍體祖先物種。研究還深入解析了異源四倍體本氏煙草的著絲粒序列及其表觀特征,豐富了我們對(duì)本氏煙草基因組進(jìn)化和著絲粒演化過(guò)程的認(rèn)識(shí)。
文章標(biāo)題:The complete genome assembly of?Nicotiana benthamiana?reveals the genetic and epigenetic landscape of centromeres
合作單位:北京大學(xué)現(xiàn)代農(nóng)業(yè)研究院
發(fā)表期刊:Nature Plants
研究對(duì)象:本氏煙草
百邁客生物為該研究提供了PacBio HiFi、Hi-C、Illumina和RNA-seq測(cè)序服務(wù)。
研究背景
本氏煙草(Nicotiana benthamiana)是一年生茄科煙草屬植物,原產(chǎn)于澳大利亞北部地區(qū),和用于制作香煙的普通煙草(N. tabaccum)是近緣物種。本氏煙草最為人知的是作為植物學(xué)和合成生物學(xué)研究的模式植物。本氏煙草憑借其對(duì)病毒的易感性和在瞬時(shí)基因表達(dá)的便利性成為了植物科學(xué)家的“寵兒”,同時(shí)它也是植物天然產(chǎn)物和疫苗異源合成的重要底盤生物。因此,解析本氏煙草的基因組密碼對(duì)促進(jìn)植物科學(xué)研究和生物制藥產(chǎn)業(yè)具有重要的價(jià)值。本氏煙草是異源四倍體,由兩個(gè)二倍體祖先在距今500萬(wàn)年-600萬(wàn)年雜交形成,之后基因組演化形成現(xiàn)今的19對(duì)染色體。本氏煙草基因組約為2.85Gb,其草圖最早發(fā)表于2012年,之后的12年間多個(gè)改進(jìn)版本的本氏煙草基因組陸續(xù)公布,組裝質(zhì)量有了很大提升,但仍然存在多個(gè)缺口與組裝注釋錯(cuò)誤,嚴(yán)重影響了對(duì)這一模式生物的功能基因組學(xué)的研究進(jìn)程。
著絲粒是負(fù)責(zé)細(xì)胞分裂過(guò)程中染色體平均分配給子細(xì)胞的基因組關(guān)鍵區(qū)域,也被稱為基因組的暗物質(zhì)區(qū)域。因其高度復(fù)雜并富含重復(fù)序列,著絲粒的序列很難被測(cè)序和破譯。近年來(lái)隨著測(cè)序技術(shù)和生物信息算法的快速發(fā)展,包括人類、擬南芥、酵母在內(nèi)的多個(gè)模式生物以及玉米、水稻、辣椒、生菜等作物的著絲粒特征逐漸被揭示。這豐富了我們對(duì)這些基因組暗物質(zhì)的認(rèn)知,為疾病研究和治療、作物單倍體育種、人工染色體合成等前沿科學(xué)提供理論指導(dǎo)。然而,我們對(duì)生物界著絲粒的結(jié)構(gòu)和進(jìn)化理解仍然處在初期,絕大多數(shù)生物的著絲粒區(qū)域仍未解析。此外,多倍體生物例如四倍體本氏煙草、四倍體馬鈴薯、六倍體小麥等,基因組經(jīng)歷了復(fù)制、重排和結(jié)構(gòu)變異等事件,在此過(guò)程中著絲粒如何演化和維持功能也有待闡明。異源四倍體的本氏煙草為這些問(wèn)題的解答提供了一個(gè)理想的模型。
研究結(jié)果
研究團(tuán)隊(duì)首先采用單分子測(cè)序技術(shù)(HiFi,116.7x?+ ONT ultra-long,47.9x),Hi-C(150x)和Bionano(329.6x)光學(xué)圖譜等多種技術(shù)相結(jié)合策略,構(gòu)建了T2T無(wú)缺口的本氏煙草基因組(2.85 Gb),實(shí)現(xiàn)所有染色體的完整分型組裝(圖1),并鑒定到所有19個(gè)著絲粒和38個(gè)端粒,contig N50值達(dá)到146.4 Mb。隨后的質(zhì)量評(píng)估表明該基因組具有很高的堿基準(zhǔn)確性和組裝完整性。

圖1-本氏煙草T2T基因組全局特征、多倍體進(jìn)化歷史和著絲粒演化進(jìn)程
研究團(tuán)隊(duì)還進(jìn)一步基于著絲粒特異結(jié)合蛋白CENH3的ChIP-seq數(shù)據(jù),確定了本氏煙草基因組的完整著絲粒序列,并揭示了其著絲粒全景特征。令人驚訝的是,與辣椒和馬鈴薯等茄科作物的著絲粒(以LTR/Gypsy反轉(zhuǎn)錄轉(zhuǎn)座子為主)不同,本氏煙草著絲粒不僅有Gypsy序列,而且存在大量的衛(wèi)星(Satellite)DNA的重復(fù)陣列,暗示這些著絲粒特異的衛(wèi)星重復(fù)序列是在本氏煙草中新出現(xiàn)的(圖2)。經(jīng)過(guò)仔細(xì)分析,研究團(tuán)隊(duì)證明了本氏煙草著絲粒衛(wèi)星陣列可能起源于核糖體DNA的基因間間隔序列。
此外,在著絲粒組蛋白CENH3優(yōu)先占據(jù)的區(qū)域,Gypsy反轉(zhuǎn)錄轉(zhuǎn)座子和核基因組線粒體插入序列(NUMT)廣泛侵入本氏煙草著絲粒,表明這些DNA元件在著絲粒功能中起著至關(guān)重要的作用。有趣的是,NUMT在本氏煙草著絲粒中的插入具有很強(qiáng)的亞基因組偏好性,并且主要與母體著絲粒周圍有關(guān)。亞基因組分析表明,衛(wèi)星陣列的出現(xiàn)可能推動(dòng)了多倍體后著絲粒的形成(圖2)。
最后,該研究提出一個(gè)模型來(lái)解釋本氏煙草著絲粒的進(jìn)化,即本氏煙草基因組在多倍化后通過(guò)新著絲粒形成、衛(wèi)星序列擴(kuò)展、反轉(zhuǎn)錄轉(zhuǎn)座子的富集和NUMT整合而實(shí)現(xiàn)著絲粒進(jìn)化(圖1),豐富了我們對(duì)于茄科植物和多倍體植物著絲粒演化的認(rèn)知。

圖2-本氏煙草著絲粒衛(wèi)星重復(fù)序列推動(dòng)新著絲粒的形成和進(jìn)化
研究總結(jié)
該研究公布了模式植物本氏煙草的T2T無(wú)缺口基因組,并揭示了其著絲粒的全景結(jié)構(gòu)及其表觀遺傳特征,該研究成果具有里程碑意義。本氏煙草完整基因組的破譯不但為植物科學(xué)研究提供了重要的遺傳資源,也將促進(jìn)本氏煙草作為模式和底盤植物在生物技術(shù)領(lǐng)域的廣泛應(yīng)用。
內(nèi)容來(lái)源于北京大學(xué)現(xiàn)代農(nóng)業(yè)研究院,侵刪