2024年4月22日,浙江省農(nóng)業(yè)科學(xué)院李國(guó)景研究員團(tuán)隊(duì)與浙江大學(xué)張明方教授團(tuán)隊(duì)合作的豇豆基因組研究成果以“Differential selection of yield and quality traits has shaped genomic signatures of cowpea domestication and improvement”為題,在國(guó)際遺傳學(xué)頂級(jí)期刊Nature Genetics(IF:30.8)上在線(xiàn)發(fā)表,百邁客生物參與了其中的測(cè)序和部分分析工作。文章通過(guò)三代PacBio HiFi數(shù)據(jù)成功構(gòu)建了1個(gè)糧用豇豆和1個(gè)菜用豇豆的高質(zhì)量基因組,并對(duì)全世界收集的344份核心種質(zhì)進(jìn)行重測(cè)序,揭示了豇豆馴化和改良的基因組選擇印跡,闡明了豇豆產(chǎn)量和品質(zhì)協(xié)同提升的遺傳機(jī)制。
研究背景
豇豆(Vigna unguiculata L. Walp., 2n = 2x = 22)起源于非洲,在世界范圍內(nèi)作為糧食、蔬菜或牲畜飼料種植。馴化豇豆已形成兩個(gè)主要栽培亞種:非洲的糧用豇豆和亞洲的菜用豇豆。這兩個(gè)亞種在許多重要的農(nóng)藝性狀上差異很大,如莢長(zhǎng)(PL)、單莢粒數(shù)(GNP)和營(yíng)養(yǎng)品質(zhì)等。
之前的研究已經(jīng)報(bào)道了一些控制豇豆馴化與改良性狀的QTLs,如裂莢性(PS)、PL、莢果品質(zhì)和種子大小等。然而,與亞種馴化相關(guān)的全基因組選擇特征尚不清楚。盡管高質(zhì)量的糧用豇豆基因組已經(jīng)發(fā)布,但由于高質(zhì)量菜用豇豆基因組信息的缺乏,闡明不同豇豆亞種馴化和改良的遺傳機(jī)制仍存在嚴(yán)重的阻礙。因此,全面解析豇豆基因組可以為不同亞種的馴化與改良提供見(jiàn)解,并為其育種改良提供重要的基因組資源。
材料方法
Denovo:
菜用豇豆G98,Illumina:107.99x;PacBio HiFi:49.36x;Hi-C:73.88Gb
糧用豇豆G323,Illumina,121.57x;PacBio HiFi:41.82x;Hi-C:68.64Gb
重測(cè)序:
344份全世界收集的豇豆核心種質(zhì),其中包括342份栽培豇豆(87份糧用豇豆、244份菜用豇豆和11份未知用途豇豆)和2份野生豇豆;Illumina測(cè)序,10x深度
基因單倍型驗(yàn)證:
菜用豇豆地方品種 ‘ZN016’ 和菜用豇豆育成品種‘Zhijiang282構(gòu)建的RIL群體(183 lines)
G98和G323構(gòu)建的F2群體(165 individuals)
研究結(jié)果
- 豇豆基因組的構(gòu)建
該研究選擇了長(zhǎng)莢菜用豇豆(G98)和抗病性強(qiáng)的糧用豇豆(G323)進(jìn)行基因組Denovo。K-mer預(yù)估G98和G323的基因組大小分別為623.16Mb和597.42Mb,最終組裝的基因組大小分別為568.24Mb(scaffold N50 = 49.41Mb)和552.66Mb(scaffold N50 = 49.35Mb)。二代回比率(G98:99.19%;G323:99.69%)、CEGMA(98%)、BUSCO(95%)和Merquery(G98:44.48;G323:47.17)評(píng)估表明本次構(gòu)建了2個(gè)高質(zhì)量的染色體水平豇豆基因組。
G98和G323分別預(yù)測(cè)到33,159和33,222個(gè)蛋白編碼基因,重復(fù)序列占基因組的56.97%(G98)和55.25%(G323),以Gypsy的長(zhǎng)末端重復(fù)反轉(zhuǎn)錄轉(zhuǎn)座子(LTRs)為主,分別占基因組的17.19%(G98)和18.72(G323)。

圖1-菜用豇豆(G98)和糧用豇豆(G323)的高質(zhì)量基因組組裝
- 豇豆的系統(tǒng)進(jìn)化與SVs
對(duì)25個(gè)物種進(jìn)行系統(tǒng)進(jìn)化樹(shù)分析顯示豇豆與赤小豆(V. angularis)和綠豆(V. radiata)親緣關(guān)系較近,它們的分化時(shí)間大約在6-27百萬(wàn)年前(圖2a),這與之前的報(bào)道一致?;蚣易宸治霭l(fā)現(xiàn)G98中有512個(gè)家族發(fā)生了顯著擴(kuò)張,這些擴(kuò)張的基因家族在參與膜組織的鞘糖脂代謝途徑顯著富集,可能與菜用豇豆的豆莢發(fā)育相關(guān)。相反,G323擴(kuò)張基因在氨基酸糖和核苷酸糖代謝、硫代葡萄糖苷-谷氨酰水解酶和半乳糖代謝等能量產(chǎn)生和轉(zhuǎn)化途徑中顯著富集(圖2b, c),這可能與糧用豇豆更高的碳水化合物積累和防御反應(yīng)有關(guān)。
作者以G323為參考基因組,對(duì)2個(gè)基因組進(jìn)行變異檢測(cè),在G98上共發(fā)現(xiàn)2,219,947個(gè)SNPs,其中38,420個(gè)SNPs可能引起基因功能的改變;發(fā)現(xiàn)407,119個(gè)InDels,其中62.50%的可能引起蛋白編碼的改變;另外,發(fā)現(xiàn)13,541個(gè)SVs(包括963個(gè)TRANS,74個(gè)INVS,3,701個(gè)DUPs,7,112個(gè)PAVs和1,691個(gè)CNVs)。
值得注意的是,作者發(fā)現(xiàn)了5個(gè)較大的SV區(qū)域(> Mb)(圖2d, f)。Chr1包含一個(gè)7.5 Mb的INV和多個(gè)相鄰的TRANS,分別包含61個(gè)和31個(gè)基因(圖2d)。Chr6包含一個(gè)4.73 Mb的INV區(qū)和一個(gè)5.14 Mb的INV區(qū),包含兩個(gè)INVs,兩個(gè)DUPs和兩個(gè)TRANS。這兩個(gè)區(qū)域分別包含42和52個(gè)基因(圖2e)。Chr10含有最大的一個(gè)INV,共包含224個(gè)基因(圖2f)。在其余染色體上共檢測(cè)到13個(gè)其它SV區(qū)域。

圖2-豇豆系統(tǒng)發(fā)育和基因組結(jié)構(gòu)變異分析
- 豇豆亞種的種群結(jié)構(gòu)與分化
作者進(jìn)一步對(duì)全世界收集的344份豇豆核心種質(zhì)進(jìn)行重測(cè)序,PCA分析將其劃分為2個(gè)聚類(lèi)(圖3a),主要由糧用豇豆(cluster I)和菜用豇豆(cluster II)組成。利用菜豆作為外群,系統(tǒng)發(fā)育樹(shù)將其劃分為以糧用豇豆(G)、菜用豇豆地方品種(VL)和菜用豇豆育成品種(VC)為中心的3個(gè)類(lèi)群(圖3b)。群體結(jié)構(gòu)分析也支持了PCA和系統(tǒng)發(fā)育樹(shù)的結(jié)果(圖3b)。
對(duì)三個(gè)亞群的核苷酸多樣性(π)和群體差異(Fst)進(jìn)行分析(圖3c)。G組(π = 0.0007)核苷酸多樣性顯著高于VL組(π = 0.00047)和VC組(π = 0.00024)。G-VC(0.1903)和G- VL(0.0924)的FST值均高于VC-VL(0.0498)。此外,與VL和VC組相比,該組的連鎖不平衡衰減更快,表明糧用豇豆的遺傳重組程度更高(圖3d)。

圖3-344份豇豆材料群體結(jié)構(gòu)和遺傳多樣性
- 豇豆馴化與改良的基因組特征
為了研究自然或人工選擇對(duì)豇豆分化的影響,作者通過(guò)選擇清除分析比較了三個(gè)豇豆亞群之間的基因組選擇特征,鑒定出239個(gè)與豇豆馴化和改良相關(guān)的基因。
進(jìn)一步結(jié)合GWAS分析,共鑒定出與嫩莢總淀粉含量(PTS)、籽粒總淀粉含量(STS)、單莢籽粒數(shù)(GNP)、嫩莢可溶性糖含量(PSS)和莢長(zhǎng)(PL)相關(guān)的18個(gè)受選擇的區(qū)域。裂莢性(PS)是最顯著的馴化性狀之一,在SNP-GWAS和InDel-GWAS中均監(jiān)測(cè)到相關(guān)位點(diǎn)。其中一個(gè)PS位點(diǎn)(PS-3.2)在344份材料中存在2個(gè)單倍型,Hapll材料的裂莢率更高(48%)(圖4b);另外3個(gè)PS位點(diǎn)(PS-3.3, PS-4.2, PS-10.3)的不同單倍型之間的裂莢率差異很小。在G和VL的馴化掃描中發(fā)現(xiàn)了6個(gè)PS相關(guān)位點(diǎn) (圖4a),解釋了這兩個(gè)亞種之間PS抗性的差異?;虮磉_(dá)分析發(fā)現(xiàn),大多數(shù)裂莢相關(guān)候選基因在G型豇豆和V型豇豆莢間的表達(dá)模式不同,表明基因的表達(dá)可能與PS呈正相關(guān)。該發(fā)現(xiàn)將為提高豇豆耐裂莢性提供理論基礎(chǔ)。

圖4-豇豆馴化與改良的選擇清除和重要性狀GWAS分析
- 豇豆的產(chǎn)量與品質(zhì)變異
產(chǎn)量相關(guān)基因和品質(zhì)相關(guān)基因在3個(gè)亞群體(G、VL和VC)中的多態(tài)性和分布揭示了豇豆表型分化的遺傳基礎(chǔ)。莢長(zhǎng)(PL)、單莢粒數(shù)(GNP)和千粒重(TSW)是影響?hù)巩a(chǎn)量的重要因素,G亞群的PL通常比VL和VC亞群的PL短得多(圖5a)。GWAS分析挖掘到與這3個(gè)性狀相關(guān)的位點(diǎn)和候選基因,并對(duì)候選基因單倍型及其表達(dá)分析,發(fā)現(xiàn)PL差異可能是由于VuPL1-HapII 和 VuPL4-HapI (圖5b) 在豇豆馴化和改良過(guò)程中強(qiáng)烈選擇引起的。在重組自交系(RIL)群體中進(jìn)一步驗(yàn)證了VuPL1和VuPL4的功能,發(fā)現(xiàn)VuPL1似乎比VuPL4在該群體中具有更強(qiáng)的作用。同時(shí)基因表達(dá)分析發(fā)現(xiàn)WAKs基因可能以劑量/轉(zhuǎn)錄依賴(lài)的方式導(dǎo)致PL差異。糧用豇豆的GNP也通常比菜用豇豆的低,可能是VuGNP2-HapIII這一有利單倍型引起的(圖5e)。TSW則可能與VuTSW1和VuTSW2基因的有利單倍型有關(guān)(圖5f),其功能也分別在RIL群體和F2群體中得到進(jìn)一步驗(yàn)證。

圖5-豇豆產(chǎn)量性狀相關(guān)基因挖掘
可溶性糖、總淀粉和粗蛋白質(zhì)含量是豆科作物的三個(gè)基本品質(zhì)性狀。GWAS分析檢測(cè)到三個(gè)信號(hào)與嫩莢可溶性糖含量(PSS)顯著相關(guān)(圖6a),其中VuPSS1可能是功能相關(guān)基因,VuPSS2可能通過(guò)其順式調(diào)控元件影響PSS含量,VuPSS3-HapIV單倍型是PSS的有利單倍型。嫩莢粗蛋白含量(PCP)差異可能與有利單倍型VuPCP1-HapII和VuPCP2-HapI有關(guān)。籽粒可溶性糖(SSS)含量相關(guān)的信號(hào)(圖6e)包含一個(gè)FAR1-related SEQUENCE (FAR1)家族蛋白(VuSSS1),F(xiàn)AR1在淀粉合成以及糖的運(yùn)輸和降解中起作用,VuSSS1-HapI為其有利單倍型(圖6f)。VuSCP2-HapIII和VuSCP2-HapIV通常導(dǎo)致更高的籽粒粗蛋白含量(SCP),VuSCP1和VuSCP2相似的表達(dá)模式提示它們可能影響種子發(fā)育中期的SCP表型。籽??偟矸酆浚⊿TS)GWAS分析檢測(cè)到5個(gè)相關(guān)信號(hào)(圖6i),STS-2.1中的VuSTS2含有一個(gè)MYB轉(zhuǎn)錄因子,STS-11.1中的VuSTS5編碼一個(gè)磷脂酰絲氨酸脫羧酶,該酶可能影響植物發(fā)育的關(guān)鍵調(diào)節(jié)因子磷脂酰絲氨酸。兩種基因的不同單倍型在兩種環(huán)境中表現(xiàn)出不同的STSs,這表明它們?cè)诤艽蟪潭壬鲜墉h(huán)境條件的影響(圖6j)。STS-3.1中的VuSTS3編碼了一個(gè)未知的蛋白,其中VuSTS3-HapIII對(duì)STS的影響最大。STS-6.1含有一個(gè)NAD依賴(lài)性蛋白去乙酰化酶VuSTS4,可能影響淀粉的生物合成和調(diào)控,而VuSTS4-HapI對(duì)STS的作用更強(qiáng)。以上結(jié)果有潛力成為糧用豇豆和菜用豇豆產(chǎn)量和品質(zhì)改善的遺傳資源。

圖6-豇豆品質(zhì)性狀相關(guān)基因挖掘
研究總結(jié)
本研究結(jié)合PacBio、Hi-C和二代測(cè)序,組裝了糧用豇豆和菜用豇豆的染色體水平基因組。對(duì)包括地方品種、野生品種和育成品種的344個(gè)材料進(jìn)行二代測(cè)序,以闡明豇豆基因組的系統(tǒng)進(jìn)化。此外,還進(jìn)行了全基因組關(guān)聯(lián)分析(GWAS),確定關(guān)鍵產(chǎn)量和品質(zhì)性狀相關(guān)基因。該研究揭示了兩個(gè)亞種之間基因組結(jié)構(gòu)變異(SVs)的全圖譜,為豇豆在全基因組選擇下的馴化與改良提供了見(jiàn)解。產(chǎn)量性狀和品質(zhì)性狀的差異基因組選擇將有助于建立糧用豇豆和菜用豇豆雙向改良的遺傳資源。
參考文獻(xiàn):Wu, X., Hu, Z., Zhang, Y. et al. Differential selection of yield and quality traits has shaped genomic signatures of cowpea domestication and improvement. Nat Genet (2024).