?2018年12月4日,華中農(nóng)業(yè)大學(xué)作物遺傳改良國(guó)家重點(diǎn)實(shí)驗(yàn)室張獻(xiàn)龍課題組首次通過(guò)三代測(cè)序(PacBio)+光學(xué)圖譜(BioNano)+Hi-C技術(shù)完成了異源四倍體陸地棉(Gossypium hirsutum)和海島棉(Gossypium barbadense)基因組組裝。該研究成果刊登于Nature Genetics,文中利用北京百邁客生物科技有限公司的三代PacBio測(cè)序組裝及Hi-C染色體掛載技術(shù),組裝獲得了高質(zhì)量栽培種異源多倍體棉基因組。>>下載文獻(xiàn)全文
中文題目:三代異源四倍體陸地棉和海島棉基因組破譯;
發(fā)表雜志:Nature Genetics;
合作單位:華中農(nóng)業(yè)大學(xué)作物遺傳改良國(guó)家重點(diǎn)實(shí)驗(yàn)室;
摘要
異源四倍體陸地棉和海島棉(Gossypium hirsutum和Gossypium barbadense)長(zhǎng)期以來(lái)一直在世界范圍內(nèi)種植,由于其具有天然可再生紡織纖維。雖然以前利用二代測(cè)序技術(shù)組裝的陸地棉和海島棉基因組在棉花研究中應(yīng)用較高,但是其基因組高度片段化且不完整。本研究中進(jìn)行了異源四倍體基因組的升級(jí),利用了三代測(cè)序組裝技術(shù)(single-molecule real-time sequencing)+光學(xué)圖譜(BioNano optical mapping)+Hi-C染色體掛載技術(shù)(high-throughput chromosome conformation capture techniques),實(shí)現(xiàn)了異源四倍體陸地棉G. hirsutum?acc. Texas Marker-1 (TM-1)?和海島棉G. barbadense?acc. 3-79基因組的組裝。與之前的二代基因組相比,三代陸地棉和海島棉基因組具有高度連續(xù)性,高度重復(fù)區(qū)(如著絲粒)具有更高的完整性。比較基因組學(xué)分析確定了廣泛的結(jié)構(gòu)變異可能發(fā)生在多倍化后,在14條染色體臂內(nèi)和臂間的倒位十分突出。研究中構(gòu)建了漸滲系群體,以導(dǎo)入從海島棉到陸地棉的有利染色體片段。從而使得研究人員可以識(shí)別與優(yōu)質(zhì)纖維質(zhì)量相關(guān)的13個(gè)數(shù)量性狀基因座。?這些資源將加速棉花的進(jìn)化和功能基因組研究,并為未來(lái)的纖維改良育種計(jì)劃提供新的信息。
研究背景
棉花是世界上*大的天然紡織纖維來(lái)源,每年纖維產(chǎn)量的90%以上來(lái)自異源四倍體棉花(G. hirsutum和G. barbadense),它起源于大約1-2百萬(wàn)年前的異源多樣化事件,隨后是數(shù)千年的不對(duì)稱(chēng)亞基因組選擇。陸地棉(G. hirsutum)由于其高產(chǎn)而在全世界種植。G. barbadense以其卓越的纖維質(zhì)量而受贊譽(yù)。為了培育產(chǎn)生纖維更長(zhǎng),更細(xì)和更強(qiáng)韌的陸地棉(G. hirsutum)品種,一種合理有效的方法是將海島棉(G. barbadense)的優(yōu)良纖維性狀引入陸地棉?;蚪M學(xué)啟動(dòng)的育種策略需要對(duì)基因組組織進(jìn)行詳細(xì)而有力的理解。
材料方法
材料:高度純合陸地棉(Texas Marker-1;TM-1)?;海島棉(3-79);
基因組denovo策略:三代測(cè)序組裝(PacBio RS II,SMRT)+光學(xué)圖譜(BioNano optical mapping)+Hi-C染色體掛載;
研究方法:基因組組裝:Canu (version 1.3)?,BLASR (version 1.3.1)?,BWA (version 0.7.10-r789)?,Pilon?(version 1.22)?;光學(xué)圖譜糾錯(cuò):核酸內(nèi)切酶Nt.BssSI23,AutoDetect,IrysSolve;Hi-C染色體掛載:核酸內(nèi)切酶HindIII,BWA(version 0.7.10-r789),LACHESIS,HiC-Pro;基因組完整性評(píng)估:BUSCO評(píng)估;TE注釋?zhuān)?/b>PASTEClassifier (version 1.0);RepeatMasker (version 4.0.6);基因預(yù)測(cè)和注釋?zhuān)?/b>Genscan,Augustus (version 2.4),GlimmerHMM (version 3.0.4),GeneID (version 1.4)和SNAP (version 2006-07-28);GeMoMa (version 1.3.1);假基因組預(yù)測(cè):GenBlastA (version 1.0.4),GeneWise (version 2.4.1);
著絲粒區(qū)域鑒定:blastn,SPSS software (version 17.0)?;基因組共線性分析:MUMmer (version 3.23),GATK(version 3.1.1),Samtools(version 0.1.19)?,MCScanX package;結(jié)構(gòu)變異檢測(cè):MUMmer3 (version 3.23);二倍體棉重測(cè)序SNPs鑒定:Trimmomatic (version 0.32),BWA;168個(gè)CSSLs群體SNPs鑒定:染色體片段置換系(CSSLs)的構(gòu)建(圖1),測(cè)序深度(6X),插入片段:350 bp,BWA,GATK和Samtools;CSSLs群體QTLs定位與表達(dá)分析:QTL IciMapping (version 4.0)?;TopHat2 (version 2.0.13)?;Cufflinks (version 2.2.1);STRUCTURE (version 2.3)?;TASSEL software (version 5.0)?;
圖1?棉花漸深系構(gòu)建流程
研究結(jié)果
? ? ? 組裝結(jié)果驗(yàn)證:將重新組裝的陸地棉與海島棉基因組與已發(fā)表的遺傳圖譜進(jìn)行比對(duì),結(jié)果顯示,每條染色體都具有高度共線性(Gossypium hirsutum?98.86%;Gossypium barbadense?96.92%);進(jìn)一步通過(guò)36個(gè)已有的BAC文庫(kù)及二代Illumina和mate-pair文庫(kù)的回比評(píng)估,并通過(guò)對(duì)陸地棉的BUSCO數(shù)據(jù)集中的1,440個(gè)高度保守的核心蛋白中的1,415個(gè)(98.2%)和對(duì)海島棉的1,420個(gè)(98.6%)的鑒定,支持了基因區(qū)組裝的完整性。與之前發(fā)表的二代基因組相比,基因組連續(xù)性顯著提高(陸地棉高出55倍,海島棉高出90倍),進(jìn)一步實(shí)現(xiàn)了gap填充,基因組高雜合區(qū)的√確組裝。本研究中陸地棉與海島棉基因組的迭代更新為后續(xù)四倍體棉花的研究提供了新版參考基因組。
表1?陸地棉和海島棉基因組組裝注釋

? ? ? 染色體結(jié)構(gòu)變異分析:高質(zhì)量的參考基因組使得研究人員能夠通過(guò)對(duì)兩種種質(zhì)的直接比較基因組分析來(lái)鑒定大的結(jié)構(gòu)變異。發(fā)現(xiàn)有170.2 Mb的基因組序列被鑒定為G. hirsutum和G. barbadense之間的反轉(zhuǎn),包括120.4 Mb的At亞基因組和49.8 Mb的Dt。有趣的是,在異染色質(zhì)中,第四條和第十一條染色體中顯示出了染色體臂內(nèi)倒位。研究中在A06染色體中發(fā)現(xiàn)了4個(gè)大的倒位變異,包括3個(gè)染色體臂內(nèi)倒位(in1, in3 and in4)和1個(gè)染色體臂間倒位(in2),通過(guò)Hi-C數(shù)據(jù)在斷點(diǎn)周?chē)x散的染色質(zhì)相互作用(圖3),突出了Hi-C技術(shù)識(shí)別大規(guī)模染色體重排的優(yōu)勢(shì)。光學(xué)圖(BioNano optical maps)譜數(shù)據(jù)進(jìn)一步支持了這些反轉(zhuǎn)斷裂位點(diǎn)(圖3)。此外,發(fā)現(xiàn)在D12染色體上,存在1個(gè)大的染色體臂間倒位。在棉花中這些染色體臂間/染色體臂內(nèi)的大量變異需要進(jìn)一步探索其生物學(xué)功能,如在擬南芥,小麥和人中所述。研究人員同時(shí)還檢測(cè)到3,820個(gè)染色體易位(1,074個(gè)染色體內(nèi)易位,占據(jù)3.8 Mb;2,746個(gè)染色體間易位,占6.8 Mb)。


四倍體陸地棉和海島棉基因組的組裝使得研究人員能夠進(jìn)一步探索四倍體棉亞基因組和其二倍體祖先之間的基因組差異。首先通過(guò)對(duì)具有D型基因組的13份二倍體材料進(jìn)行重測(cè)序分析,分析顯示在兩種四倍體棉D-亞基因組具有相同的二倍體祖先種雷蒙德氏棉G. raimondii(D5 genome,D亞基因組供體);進(jìn)而利用二倍體雷蒙德氏棉G. raimondii直接進(jìn)行基因組比較分析,發(fā)現(xiàn)四倍體陸地棉和海島棉與雷蒙德氏棉相比,都有一些獨(dú)特的結(jié)構(gòu)變異,如在海島棉染色體D05和陸地棉D12中均存在大的染色體臂間倒位,暗示這些變異出現(xiàn)在多倍化之后(圖5)。研究人員還觀察到兩個(gè)四倍體相對(duì)于G. raimondii共有一些結(jié)構(gòu)變異,例如染色體D09中兩個(gè)四倍體發(fā)生了大的反轉(zhuǎn)(圖5)。研究中同時(shí)運(yùn)用了二倍體祖先種亞洲棉G. arboreum(A2 genome,A亞基因組供體)的Hi-C數(shù)據(jù),與陸地棉和海島棉A亞基因組進(jìn)行比對(duì),檢測(cè)棉由二倍體到四倍體多倍化過(guò)程中發(fā)生的結(jié)構(gòu)變異,Hi-C具體矩陣圖顯示在13條染色體中發(fā)生了大規(guī)模的染色體重排,其中發(fā)部分變異為兩個(gè)四倍體的棉的A亞基因組共有。研究中發(fā)現(xiàn)染色體A06中*大的染色體臂間倒位(in2)在陸地棉中是特有的(圖3?左),表明這種結(jié)構(gòu)變異可能在染色體多倍化后發(fā)生。因此得出結(jié)論,二倍體棉花中的A基因組在異源多倍化后被重組,導(dǎo)致不同四倍體(陸地棉和海島棉)中發(fā)生了大染色體倒位。

通過(guò)研究發(fā)現(xiàn)了在陸地棉(G.?hirsutum?acc. TM-1)和海島棉(G. barbadense?acc. 3-79)間存在廣泛的遺傳變異,進(jìn)一步推測(cè)這些變異的一部分可能是造成表型差異的原因,包括纖維性狀。為了利用這些變異進(jìn)行定向育種,研究人員構(gòu)建了一個(gè)漸滲系群體,旨在引入有利的變異,控制從G.barbadense到G. hirsutum等重要農(nóng)藝性狀的形成,如纖維質(zhì)量。研究人員通過(guò)分子標(biāo)記對(duì)168份漸滲系材料進(jìn)行測(cè)序,并鑒定了涵蓋所有26條染色體的466個(gè)基因滲入片段(圖6)。研究人員發(fā)現(xiàn)了在染色體D12中含有漸滲片段的漸滲系,其具有有限的絨毛纖維,類(lèi)似于其供體親本G.barbadense?3-79(圖6,圖7上),基因滲入片段的位置與無(wú)絨天然突變體G. hirsutum?Xuzhou142fl的圖譜測(cè)序所示的位置相同,然而其遺傳基礎(chǔ)以前未被充分了解(圖7下)。這些結(jié)果表明,陸地棉(G. hirsutum)中無(wú)絨毛突變體的遺傳變異與海島棉(G. barbadense)中的數(shù)量性狀基因座(QTL)共定位。該漸滲片段與天然纖維突變體的特征將有助于比較分析海島棉和陸地棉之間的絨毛纖維起始機(jī)制。
為了鑒定海島棉(G. barbadense)中優(yōu)質(zhì)纖維質(zhì)量的有益等位基因,研究人員對(duì)漸滲群體中的纖維品質(zhì)相關(guān)性狀進(jìn)行了QTL分析。研究中共計(jì)鑒定了5個(gè)性狀的13個(gè)QTLs位點(diǎn),其中控制纖維長(zhǎng)度位點(diǎn)2個(gè),控制纖維強(qiáng)度位點(diǎn)4個(gè),馬克隆值位點(diǎn)2個(gè),纖維伸長(zhǎng)率位點(diǎn)2個(gè),纖維均勻度位點(diǎn)3個(gè)(圖8 a-c)。在這些QTLs位點(diǎn)中,9個(gè)位點(diǎn)之前未被鑒定出,通過(guò)檢驗(yàn)13個(gè)QTLs中的基因表達(dá)水平,研究人員檢測(cè)到了235個(gè)在纖維發(fā)育過(guò)程中高度表達(dá)的基因,同時(shí)還整合了基因組變異數(shù)據(jù)來(lái)預(yù)測(cè)候選基因,而這些基因值得進(jìn)一步進(jìn)行精細(xì)定位以確認(rèn)對(duì)這些性狀具有重要影響的基因。研究人員發(fā)現(xiàn)A02染色體上的1個(gè)QTL位點(diǎn)與纖維長(zhǎng)度相關(guān),在這個(gè)QTL中,一個(gè)未鑒定過(guò)的基因(Ghir_A02G003440),編碼預(yù)測(cè)的糖基磷脂酰肌醇錨定的脂質(zhì)轉(zhuǎn)移蛋白,該基因在纖維伸長(zhǎng)期的表達(dá)水平和深入系中纖維長(zhǎng)度呈負(fù)相關(guān),并可能與海島棉中長(zhǎng)纖維的發(fā)育相關(guān)。這些QTL數(shù)據(jù)為海島棉基因組片段的詳細(xì)功能分析提供了框架,并應(yīng)通過(guò)基因滲入育種進(jìn)一步開(kāi)發(fā)具有優(yōu)質(zhì)性狀的栽培棉花。

總結(jié)
回顧整個(gè)2018年,百邁客NG文章收獲滿滿,于2018年5月與中國(guó)農(nóng)業(yè)科學(xué)院棉花研究所杜雄明研究員合作成功完成了亞洲棉基因組的升級(jí),又在2018年10月與福建農(nóng)林大學(xué)基因組研究中心明瑞光課題組合作,完成了同源多倍體甘蔗基因組密碼的破譯。同時(shí),于2018年巨資投入,引進(jìn)三代測(cè)序Nanopore單分子納米孔測(cè)序儀,成為了國(guó)內(nèi)動(dòng)植物基因組denovo研究第一家。
另外,還可以獲贈(zèng)100元在線培訓(xùn)課程代金券!
相關(guān)閱讀