2016年9月6日 Nature Genetics 在線發(fā)表由浙江大學(xué)種質(zhì)創(chuàng)新和分子育種檢驗(yàn)實(shí)驗(yàn)室的張明方教授、楊景華老師與北京百邁客生物科技有限公司、中國農(nóng)業(yè)部園藝植物生長發(fā)育與品質(zhì)改良重點(diǎn)實(shí)驗(yàn)室、浙江園藝植物綜合生物學(xué)省級(jí)實(shí)驗(yàn)室、中國農(nóng)業(yè)科學(xué)院蔬菜和花卉研究所、北京蔬菜研究中心、西澳大利亞大學(xué)等合作研究的異源四倍體芥菜基因組,在此為大家深入的解讀下這篇文章。
The genome sequence of allopolyploid Brassica juncea and analysis of differential homoeolog gene expression influencing selection.
一 ?研究背景
圖1.蕓薹屬禹氏三角(From Wikipedia)
異源四倍體芥菜(AABB)屬于十字花科蕓薹屬,是重要經(jīng)濟(jì)作物,主要包括菜用和油用芥菜兩大類群,種植范圍較廣,經(jīng)濟(jì)價(jià)值較大。菜用芥菜主要分布在中國等東亞國家和地區(qū),油用芥菜主要分布在印度等南亞國家和地區(qū)。芥菜是“禹氏三角”中重要的一員,由白菜和黑芥雜交后加倍而來,至少發(fā)生了三次古多倍化事件,因此非常具有研究價(jià)值。但是由于其為異源多倍體,相關(guān)的全基因組測(cè)序工作一直很難開展。來自浙江大學(xué)、北京百邁客等單位的團(tuán)隊(duì)共同合作,利用新的測(cè)序技術(shù)(PacBio+BioNano),成功的組裝出高質(zhì)量的芥菜基因組圖譜,為進(jìn)一步改良芥菜的農(nóng)藝性狀提供了基礎(chǔ),為多倍體物種遺傳育種提供了新的方向。同時(shí),也從多角度論證了芥菜A亞基因組起源問題,揭示了多倍體亞基因組間同源基因表達(dá)與選擇機(jī)制。
二 ?研究方法
1、組裝
基于文章設(shè)計(jì),我們選取菜用芥菜的一個(gè)變種(榨菜),使用二代測(cè)序和三代測(cè)序相結(jié)合的方法進(jìn)行初步組裝,然后利用光學(xué)圖譜進(jìn)行校正,得到了一版高質(zhì)量的芥菜基因組,其中contig N50 由 28Kb 提升到61Kb ,scaffold N50 由710k 提升到1.5Mb.基因組完整性達(dá)到85%。另外我們還利用二代測(cè)序技術(shù)組裝了一版黑芥的基因組,基因組大小為591Mb,完整度為68%。
然后利用遺傳圖和光學(xué)圖譜對(duì)A、B亞基因組進(jìn)行區(qū)分,整體掛載效果非常好,A為91.48%,B為72.32%。利用光學(xué)圖譜和遺傳圖譜對(duì)基因組進(jìn)行區(qū)分,為其他多倍體物種基因組研究提供了參考。
2、基因組注釋情況
在高質(zhì)量的基因組的情況下,我們采用從頭+同源+轉(zhuǎn)錄組結(jié)合的方法在芥菜基因組中獲得了80050個(gè)編碼蛋白的基因,其中有97.8%的基因可以注釋到Nr庫。另外黑芥基因組預(yù)測(cè)出來49826個(gè)編碼蛋白的基因,其中94.7%可以注釋到Nr。重復(fù)序列部分芥菜A基因組中重復(fù)序列比例為44.25%,B為52.37%。芥菜基因組特征情況見下圖:
三 ?研究結(jié)果
1、芥菜A亞基因組起源問題
芥菜的基因組是異源四倍體(AABB),在“禹氏三角”中由白菜(AA),黑芥(BB)雜交后加倍形成,在演化過程中變異類型非常豐富。問題是油用芥菜的AA和菜用芥菜的AA是來自同一個(gè)亞種,還是來自多個(gè)亞種呢,這個(gè)問題就是A亞基因組的起源問題。
如上圖,a中對(duì)芥菜A、白菜A、甘藍(lán)型油菜A進(jìn)行共線性分析,可以發(fā)現(xiàn)其是高度共線的。
我們對(duì)10個(gè)菜用的芥菜、7個(gè)油用的芥菜,5個(gè)甘藍(lán)型油菜基因組、27個(gè)白菜基因組(多亞種)進(jìn)行了重測(cè)序分析,并繪制如上圖b中的進(jìn)化樹。從b圖中可以看到芥菜全部聚在一起,沒有出現(xiàn)分散的情況,說明芥菜中A的基因組是來源于同一個(gè)亞種,屬于單系起源。
C圖中對(duì)同源物種和芥菜進(jìn)行了進(jìn)化樹構(gòu)建,并計(jì)算了芥菜分化的具體時(shí)間為3-5萬年。
除了從群體的角度研究了芥菜亞基因組A起源問題,還從PCA聚類和Fixed SNP角度驗(yàn)正了單系起源的結(jié)論。
2、基因表達(dá)的dominance現(xiàn)象
由于芥菜基因組是異源四倍體,也就是說基因組中存在兩套非常相似的亞基因組,那么在基因表達(dá)的過程中,位于兩套亞基因組上的等位基因的表達(dá)模式是怎么樣的呢,是一起表達(dá),是相互抑制,還是一方占主導(dǎo)?
通過計(jì)算等位基因的表達(dá)量,發(fā)現(xiàn)在不同的時(shí)期,不同組織之間,發(fā)現(xiàn)存在dominance基因,存在dominance的基因經(jīng)受的選擇壓力大于Neutral基因(不存在dominance現(xiàn)象,功能非常重要,純化作用較強(qiáng),不輕易突變),但是小于Subordinate基因(作用不重要,純化作用較小,易丟失)。
3、油用芥菜和菜用芥菜的選擇與分化
通過菜用和油用芥菜群體進(jìn)行選擇清除分析,發(fā)現(xiàn)dominance的基因被篩選出來的比例較高,同時(shí)結(jié)合轉(zhuǎn)錄組數(shù)據(jù),這部分基因在油用和菜用兩個(gè)群體中差異表達(dá)。同時(shí)通過上面的分析發(fā)現(xiàn)與硫苷,脂類代謝顯著相關(guān)并且存在dominance的基因組,這些基因在油用菜用群體中有各自獨(dú)特基因分型。
四 ?文章亮點(diǎn)
1. 多倍體復(fù)雜基因組解決方案:二代+三代+光學(xué),組裝出高質(zhì)量復(fù)雜基因組;
2. 多個(gè)角度證據(jù)解決芥菜亞基因組A亞基因組單系起源/雜交起源爭(zhēng)論:Asubgenome phylogenetic tree,PCA, polymprphism and fixed SNP;
3. 通過構(gòu)建群體模型及貝葉斯方法評(píng)估多倍體芥菜形成時(shí)間上下限,為新多倍體物種形成時(shí)間估算提供新方法;
4. 從不同發(fā)育時(shí)期,不同組織,不同處理?xiàng)l件,不同進(jìn)化時(shí)期多個(gè)角度系統(tǒng)分析異源多倍體dominance 現(xiàn)象;
5. 通過油用菜用群體選擇角度識(shí)別vegetable- and oil- use B. juncea 分化選擇區(qū)域,發(fā)現(xiàn)與硫苷,脂類代謝顯著相關(guān)并且存在dominance的基因組,這些基因在油用菜用群體中有各自獨(dú)特基因分型;
6. 首次找到dominance gene 與潛在農(nóng)藝性狀選擇相關(guān)性的證據(jù),為多倍體物種遺傳育種提供了新的方向和基因候選材料。
五 ?摘 要
The Brassica genus encompasses three diploid and three allopolyploid genomes, but a clear understanding of the evolution of agriculturally important traits via polyploidy is lacking. We assembled an allopolyploid Brassica juncea genome by shotgun and single-molecule reads integrated to genomic and genetic maps. We discovered that the A subgenomes of B. juncea and Brassica napus each had independent origins. Results suggested that A subgenomes of B. juncea were of monophyletic origin and evolved into vegetable-use and oil-use subvarieties. Homoeolog expression dominance occurs between subgenomes of allopolyploid B. juncea, in which differentially expressed genes display more selection potential than neutral genes. Homoeolog expression dominance in B. juncea has facilitated selection of glucosinolate and lipid metabolism genes in subvarieties used as vegetables and for oil production. These homoeolog expression dominance relationships among Brassicaceae genomes have contributed to selection response, predicting the directional effects of selection in a polyploid crop genome.
六 ?參考文獻(xiàn)
[1] The genome sequence of allopolyploid Brassica juncea and analysis of differential homoeolog gene expression influencing selection.