2021年5月,華中農(nóng)業(yè)大學(xué)棉花遺傳改良團(tuán)隊(duì)研究成果“Comparative genome analyses highlight transposon-mediated genome expansion and the evolutionary architecture of 3D genomic folding in cotton”發(fā)表于國(guó)際學(xué)術(shù)期刊Molecular Biology and Evolution(IF:16.241)。華中農(nóng)業(yè)大學(xué)王茂軍教授和李健英博士為論文共同第一作者,張獻(xiàn)龍教授、中國(guó)農(nóng)業(yè)科學(xué)院棉花研究所王坤波研究員和愛荷華州立大學(xué)Jonathan F. Wendel教授為共同通訊作者,百邁客也有幸參與其中基因組相關(guān)工作。
為了更好的分享熱門科研進(jìn)展與研究經(jīng)歷,助力科研解讀基因,百邁客特邀李健英博士,于11月12日以直播的形式,為我們分享棉花轉(zhuǎn)座子與基因組三維結(jié)構(gòu)進(jìn)化的奧秘(掃描圖中二維碼即可免費(fèi)報(bào)名參與)。
文章詳細(xì)解讀
研究背景
轉(zhuǎn)座因子(Transposable elements,TEs)在真核生物基因組結(jié)構(gòu)的形成中起著重要作用。TE擴(kuò)增和消除影響物種的表型變異、基因轉(zhuǎn)錄、基因組進(jìn)化和群體多樣性。最近的研究表明TEs也可能影響3D基因組結(jié)構(gòu),而在植物中,差異TE積累引起的基因組大小的顯著變化對(duì)染色質(zhì)高級(jí)結(jié)構(gòu)進(jìn)化的調(diào)節(jié)作用仍然未知。
棉屬是棉族(Gossypium)里最大的屬,含有大約52個(gè)種,共9種基因組類型,包括二倍體基因組A-G、K(2n = 2x= 26)和四倍體AD1-AD7(2n = 4x= 52)。其中最大的二倍體基因組屬于K組(~2.6 Gb)與四倍體棉花基因組(~2.4 Gb)相似,約為最小二倍體棉種的三倍(D基因組;~840Mb)。因此,棉花是基因組大小進(jìn)化與轉(zhuǎn)座子擴(kuò)增及染色質(zhì)高級(jí)結(jié)構(gòu)形成進(jìn)化研究的重要資源。
材料與方法
材料:圓葉棉G. rotundifolium (K2) 、亞洲棉G. arboreum (A2)、雷蒙德氏棉G. raimondii (D5)新鮮葉片
測(cè)序:
基因組:K2、A2和D5分別 108×, 118×, 132×illumina以及124×, 131×, 167× Nanopore
Hi-C掛載:6堿基酶HindⅢ;K2、A2和D5分辨率分別為20kb、20kb、10kb
Hi-C互作:4堿基酶DpnⅡ;分辨率20 Kb, 50 Kb, 100 Kb.
研究結(jié)果
1. 圓葉棉、亞洲棉、雷蒙德氏棉基因組組裝注釋
作者利用Nanopore測(cè)序技術(shù)組裝了圓葉棉(K2)基因組,組裝大小為2.44Gb(contigN50 = 5.33 Mb);并提升了亞洲棉(A2)和雷蒙德氏棉(D5)的基因組,組裝大小分別為1.62 Gb (contigN50 = 11.69 Mb)和0.75 Gb(contigN50 =17.04 Mb)(表1)。Hi-C掛載率均超過99%,BUSCO結(jié)果分別為 92.5%, 93.9%,及95.4%。眾多指標(biāo)表明,本次組裝的三個(gè)二倍體棉花品種基因組為參考級(jí)基因組水平。
表1 三種棉組裝結(jié)果
通過從頭預(yù)測(cè)、同源預(yù)測(cè)與轉(zhuǎn)錄預(yù)測(cè)結(jié)合的方式,在K2、A2和D5分別注釋到41,590, 41,778與40,820個(gè)基因。與許多植物一樣,三種棉中重復(fù)序列非常豐富,分別占到了每個(gè)基因組的57-81%,并且含量隨基因組的增加而擴(kuò)張(K2=1978 Mb、A2=1103 Mb和D5=428 Mb)(圖1)。重復(fù)序列注釋表明,棉種特異的反轉(zhuǎn)錄轉(zhuǎn)座子(LTR)擴(kuò)增是造成D5、K2和A2這三個(gè)棉種基因組大小呈現(xiàn)三倍差異的原因, 尤其是Gypsy和DIRS類型。
圖1 圓葉棉基因組特征
在K2中,LTR逆轉(zhuǎn)錄轉(zhuǎn)座子的插入時(shí)間峰值出現(xiàn)在4.5-5 MYA,A2在0.6-1 MYA有一個(gè)較新的擴(kuò)增峰值,表明K2基因組中轉(zhuǎn)座子插入最為古老,并在5 MYA左右獲得了大量LTR,而A2基因組有更多新的轉(zhuǎn)座子。系統(tǒng)發(fā)育樹顯示Clade III中Gypsy-like的逆轉(zhuǎn)錄轉(zhuǎn)座子的巨大Gorge3擴(kuò)張(圖2)。
圖2 三種棉中TE進(jìn)化特征
2. 比較基因組學(xué)和進(jìn)化
比較基因組分析表明,A2和K2基因組在Chr01與Chr02染色體間存在一個(gè)大的易位;K2和D5基因組在Chr13與Chr05染色體間存在一個(gè)大的易位。Ks分析與前期研究一致,結(jié)果表明,三個(gè)棉種在57-71百萬(wàn)年前存在一次共同的全基因組復(fù)制事件(圖3),并在5.1-5.4 百萬(wàn)年前發(fā)生物種分化,K2、A2和D5基因組與它們最近的外類群約在8.5-10 百萬(wàn)年前發(fā)生了分化。由于這三個(gè)基因組來自同一祖先,作者探討了物種形成后共線基因丟失和增加的程度。分析表明結(jié)果表明,K2和D5/A2之間的比較顯示 K2缺失基因數(shù)量最多(D5和A2有5868個(gè)共線,而K2中沒有).使用OrthoMCL進(jìn)行的基因家族分析,發(fā)現(xiàn)三個(gè)棉中每個(gè)基因組大約有15%特異的基因家族。
圖3 基因組共線性與進(jìn)化
3. A/B compartment演化
植物染色質(zhì)被劃分為“活性”(A)或“非活性”(B)區(qū)域,通常分別對(duì)應(yīng)于常染色質(zhì)和異染色質(zhì)。HiC染色質(zhì)互作分析發(fā)現(xiàn),與基因組大小的差異一致,與A2或D5相比,K2基因組的活躍區(qū)域(約占基因組的44%)較少,而非活躍區(qū)域(55%)較多。較大的K2和A2基因組在A/B compartment之間表現(xiàn)出更多的插入,與這些較大基因組中發(fā)現(xiàn)的富含TE的區(qū)域相對(duì)應(yīng)。A2/K2與D5相比多了約7000個(gè)基因,這與活躍的轉(zhuǎn)座子擴(kuò)增相關(guān)。對(duì)于較大的基因組,一個(gè)compartment中TEs的比例也稍大,表明這些較大基因組(K2和A2)所顯示的A/B compartment變化模式導(dǎo)致更擴(kuò)散的邊界,并在A compartment中包含更多的基因和TEs。
K2與A2及與D5相比更多的傾向于A向B的轉(zhuǎn)化。K2和A2中有更多的基因處于A compartment,D5中有更多的基因處于B compartment。功能富集分析結(jié)果表明,A-to-B基因在離子結(jié)合和轉(zhuǎn)錄因子活性途徑中富集,而B-to-A基因參與基本活性,如泛素轉(zhuǎn)移酶活性、果膠酸裂解酶活性和ATP結(jié)合。表達(dá)分析顯示,表達(dá)的TEs可能參與了A-to-B區(qū)的轉(zhuǎn)換,這與基因轉(zhuǎn)錄有關(guān)。
圖4 三種棉中A/B compartment 特征
4. TAD結(jié)構(gòu)演化及轉(zhuǎn)座子擴(kuò)增對(duì)TAD結(jié)構(gòu)影響研究
拓?fù)浣Y(jié)構(gòu)域(TAD)是位于A/B compartment內(nèi)的較小域,表現(xiàn)出頻繁的域內(nèi)相互作用,與位于域外的位點(diǎn)的相互作用頻率較低。由于TAD邊界的轉(zhuǎn)換可以指示結(jié)構(gòu)重組,作者比較了共線區(qū)中的TAD邊界,以探索三個(gè)基因組中的TAD保護(hù)和轉(zhuǎn)換。研究發(fā)現(xiàn),在三個(gè)基因組中,K2中有406個(gè)TAD邊界是保守的,并且隨著TAD總數(shù)的增加,譜系特異性邊界的數(shù)量增加。K2基因組在TAD邊界的基因數(shù)最少,而D5的基因數(shù)最多(圖5)。大約60%的拓?fù)浣Y(jié)構(gòu)域(TAD)在三個(gè)基因組中發(fā)生了重新組織,K2基因組中有更多特異的TAD。TAD邊界處的motif分析顯示69個(gè)特定于K2的motif,但A2和D5中分別只有8個(gè)和4個(gè)特定motif。
基于邊界TE覆蓋度,邊界TE表達(dá)以及TE插入時(shí)間分析,發(fā)現(xiàn)K2不保守的TAD邊界存在特異的和較新的轉(zhuǎn)座子(物種分化后爆發(fā)的TE)插入。這些結(jié)果表明最近在K2和A2基因組中表達(dá)的TEs的擴(kuò)增可能有助于在三個(gè)物種分化后形成譜系特異性TAD邊界。基于這些結(jié)果,作者提出了三個(gè)棉種分化過程中,基因組擴(kuò)張-轉(zhuǎn)座子擴(kuò)增介導(dǎo)的A/B compartment轉(zhuǎn)換和TAD重組的進(jìn)化模型(圖6)。
圖5 特異和保守的TADs
圖 6 TE擴(kuò)增對(duì)TAD邊界重組的影響
小結(jié)
本次研究首次公布了棉屬中二倍體圓葉棉基因組,并對(duì)亞洲棉和雷蒙德氏棉基因組進(jìn)行了升級(jí),解析了轉(zhuǎn)座子活動(dòng)驅(qū)動(dòng)的基因組大小進(jìn)化特征,從轉(zhuǎn)座子擴(kuò)增和染色質(zhì)空間結(jié)構(gòu)角度為棉花物種進(jìn)化提供新的見解,為植物中轉(zhuǎn)座子活動(dòng)介導(dǎo)的轉(zhuǎn)錄調(diào)控進(jìn)化研究提供參考。
原文鏈接:
https://academic.oup.com/mbe/article/38/9/3621/6262643