英文標(biāo)題:Haplotype‐resolved genome of a papeda provides insights into the geographical origin and evolution of Citrus
發(fā)表期刊:Journal of Integrative Plant Biology
影響因子:9.3
合作單位:西南大學(xué)柑桔研究所等
百邁客生物為該研究提供了基因組測(cè)序及組裝等相關(guān)工作。
柑橘是世界上種植最廣泛的水果之一,目前在140多個(gè)國家和地區(qū)種植。雖然過去的二十年里柑橘植物的種群結(jié)構(gòu)和遺傳多樣性已被調(diào)查,但由于其豐富的資源類型和雜交頻繁,許多柑橘物種的起源和進(jìn)化仍不清楚。野生柑橘物種和原始柑橘保存了豐富的遺傳資源和遺傳多樣性,可用于闡明柑橘物種的起源和進(jìn)化。2015年,在西雙版納發(fā)現(xiàn)一棵200多年的野生柑橘樹大翼葉柑橘(DYC002),被認(rèn)為是研究柑橘進(jìn)化及苦味馴化的很好材料。
DYC002單倍型基因組組裝:PacBio HiFi 180×;llumina 75×;HIC 134×
群體進(jìn)化研究:378份具有代表性的材料進(jìn)行全基因組重測(cè)序分析;平均測(cè)序深度32.6×
DYC002轉(zhuǎn)錄組測(cè)序:幼葉、莖、花、小果和根(3個(gè)生物學(xué)重復(fù))
作者利用53.7G PacBio HiFi、22.6G illumina reads和40.1G Hi-Creads,首先組裝出318.71 Mbp大小的contig版本基因組,contig N50為2.48 M,接著利用HIC數(shù)據(jù)將contig 掛載到染色體上,得到得到294 Mbp的基因組,BUSCO評(píng)估完整性大于98%,LTR組裝指數(shù)(LAI)得分高達(dá)21.1,測(cè)序數(shù)據(jù)回比率為97.43%,進(jìn)一步支持了組裝的完整性。最后對(duì)DYC002基因組注釋,共注釋到34,652個(gè)蛋白編碼基因和215,693個(gè)重復(fù)序列。重復(fù)序列多為LTR,尤其是Gypsy LTR和Copia LTR,占組裝基因組的23.62%。比較基因組發(fā)現(xiàn)DYC002有191個(gè)基因家族正在快速進(jìn)化。GO富集分析表明,這些快速進(jìn)化的基因主要富集于萜烯合酶活性、倍半萜合酶活性、(4S)-檸檬烯合酶活性、(E)-檸檬烯合酶活性、葡萄糖苷酶活性和-葡萄糖苷酶活性等功能,表明DYC002在進(jìn)化過程中香氣和風(fēng)味發(fā)生了顯著變化。
圖1-比較基因組分析
利用CCS數(shù)據(jù)和HIC數(shù)據(jù),作者組裝出DYC002的兩套單倍型基因組,長度分別為294和300 Mbp,注釋的基因數(shù)量分別為28000和27785個(gè);BUSCO完整度分別為97.39%和97.33%。通過比較分析,兩單倍型基因組間存在175萬個(gè)SNPs,303,686個(gè)Indels,轉(zhuǎn)錄組分析表明,兩個(gè)單倍型中等位基因的表達(dá)高度一致。葉片中等位基因特異性表達(dá)基因(ASEGs)數(shù)量最高,而花中數(shù)量最低。在單倍型1和單倍型2的組裝中分別發(fā)現(xiàn)了535個(gè)和499個(gè)單倍型特異性基因。
圖2-單倍型基因組比較分析
為了說明柑橘物種的進(jìn)化歷史,作者從378份具有代表性的柑橘材料中獲得了基因組重測(cè)序數(shù)據(jù),利用核基因組SNPs進(jìn)行的系統(tǒng)發(fā)育分析,除了莽山野柑,柑橘屬可分為兩個(gè)進(jìn)化支,一支以寬皮柑橘、宜昌橙、香橙、甜橙等為代表,另一支包括大翼橙、澳指檬、澳沙檬、枸櫞、紅河大翼橙、柚、酸橙等。推測(cè)柑橘屬植物從起源中心朝東南亞和中國東部兩個(gè)方向進(jìn)行演化和傳播。選擇性清除分析表明,苦味在柑橘馴化過程中具有較高的選擇,共鑒定出672個(gè)選擇性掃描區(qū),一些參與類檸檬苦素和類黃酮生物合成的4-香豆酸-CoA連接酶、糖苷轉(zhuǎn)移酶受到選擇。
圖3-群體進(jìn)化分析
高質(zhì)量基因組的發(fā)表對(duì)了解柑橘發(fā)揮重要作用。然而,由于其復(fù)雜的遺傳背景,許多柑橘物種的起源和進(jìn)化仍不清楚。作者從頭組裝了DYC002的294mbp染色體水平的基因組,對(duì)兩個(gè)單倍型基因組比較,發(fā)現(xiàn)了1.2%的基因組內(nèi)變異,包括175 萬個(gè)SNPs,149,471個(gè)插入和154,215個(gè)缺失。以該基因組為參考,對(duì)378份具有代表性的柑橘材料進(jìn)行了重測(cè)序和系統(tǒng)發(fā)育分析,作者研究柑橘屬可分為兩個(gè)進(jìn)化支,證實(shí)了柑橘核心種的主要起源中心是華南地區(qū),特別是喜馬拉雅-橫斷山脈。該研究為了解柑橘品種的起源和進(jìn)化提供了新的視角,并可能為柑橘育種和改良提供有價(jià)值的基因組資源。
]]>
文章題目:T2T?genome,?pan-genome?analysis?and?heat?stress response?genes?in?Rhododendron?species
發(fā)表期刊:iMeta
影響因子:23.8
合作單位:貴州大學(xué),華北理工大學(xué)
百邁客生物為此項(xiàng)研究提供基因組測(cè)序及部分分析服務(wù)。
研究亮點(diǎn):
① 該研究首次報(bào)道了具有13條染色體的高質(zhì)量端粒到端粒(T2T)的百合杜鵑基因組;
② 基于15個(gè)杜鵑屬植物基因組,對(duì)杜鵑屬植物進(jìn)行了泛基因組分析;
③ 結(jié)合基因組測(cè)序和全轉(zhuǎn)錄組測(cè)序,鑒定了幾個(gè)與熱脅迫相關(guān)的關(guān)鍵基因和miRNA,為杜鵑屬植物的比較基因組學(xué)和功能基因組學(xué)研究提供了豐富的資源。
杜鵑花屬于杜鵑花科,是木本植物中最大的屬之一。全世界大約有1000種杜鵑花,中國是重要的分布中心。它們?cè)谙柴R拉雅-橫斷山脈經(jīng)歷了進(jìn)化輻射,橫斷山脈是世界生物多樣性的熱點(diǎn)。杜鵑花屬植物因其觀賞價(jià)值而在園藝中占有重要地位。全球氣候變化導(dǎo)致溫度升高,而熱脅迫會(huì)影響植物的生長發(fā)育。然而,杜鵑花植物通常適應(yīng)較冷的氣候。利用多組學(xué)分析和分子生物學(xué)技術(shù)研究杜鵑花對(duì)高溫脅迫的響應(yīng)機(jī)制,對(duì)選育耐熱品種、擴(kuò)大杜鵑花栽培范圍具有重要意義。
T2T基因組組裝:Rhododendron liliiflorum
泛基因組分析:4個(gè)本次組裝的基因組+11個(gè)已報(bào)到的杜鵑屬基因組
全轉(zhuǎn)錄組:CK熱處理、熱處理3天(H3)和6天(H6)條件下進(jìn)行了全轉(zhuǎn)錄組測(cè)序
兩對(duì)具有代表性的miRNAs和相關(guān)靶基因進(jìn)行功能驗(yàn)證。
1.杜鵑屬植物基因組測(cè)序、組裝與評(píng)價(jià)
該研究通過PacBio HiFi、Oxford Nanopore Technology(ONT)、Illumina和Hi-C技術(shù)(圖1A,表S1-6)對(duì)四種杜鵑花植物(Rhododendron liliiflorum、Rhododendron decorum、Rhododendron platypodum和Rhododendron concinnum)進(jìn)行從頭基因組測(cè)序。通過K-mer估算的R. liliiflorum、R. decorum、R. platypodum和R. concinnum的基因組大小分別為759.08 Mb、581.05 Mb、593.47 Mb和1356.22 Mb,并通過流式細(xì)胞術(shù)進(jìn)一步驗(yàn)證(表S1,圖1B)。
作者發(fā)現(xiàn),R. concinnum的基因組幾乎是其他三個(gè)物種的兩倍大。因此,作者們利用流式細(xì)胞術(shù)進(jìn)一步分析了染色體核型,首次發(fā)現(xiàn)R. concinnum為四倍體,核型為2n=4x=52,與其他三個(gè)二倍體物種(2n=2x=26)有明顯差異(圖1C,表S1)。
4個(gè)物種的基因組大小分別為793.25 Mb、649.87 Mb、652.27 Mb和1321.11 Mb(表S1)。經(jīng)Hi-C檢測(cè),4個(gè)種的染色體錨定率均在97.90%以上(圖1D,表S5)。作者獲得了4個(gè)高質(zhì)量的組裝基因組,支架N50大于48.68 Mb。核心真核基因作圖法(CEGMA)值從95.63%到99.56%,基準(zhǔn)通用單拷貝同源序列(BUSCO)值從96.65%到97.34%,讀取作圖率超過99.40%(表S7)。
最重要的是,作者獲得了一個(gè)高質(zhì)量的R. liliiflorumT2T基因組,該基因組由13條染色體組成,檢測(cè)到24個(gè)端粒和13個(gè)著絲粒(圖S1A,表S8-11)。其中11條染色體在端粒與端粒之間沒有間隙,另外2條染色體只有一個(gè)間隙。百合杜鵑花基因組的重疊群N50大于58.56MB,大于以往大多數(shù)杜鵑基因組的重疊群N50。采用BUSCO軟件對(duì)基因組完整性進(jìn)行評(píng)估(96.65%),基因組一致性質(zhì)量值(QV)為43.71(表S1)?;蚪MLTR組裝指數(shù)(LAI)值為21.15(圖S1B),表明已達(dá)到最高質(zhì)量水平(LAI≥20)。
重復(fù)序列占4個(gè)基因組的49.10%以上,以長末端重復(fù)序列(LTRs)最多(圖1E,表S11)。在這四個(gè)基因組中,共預(yù)測(cè)到41406、41084、40556和83203個(gè)基因(表S12)。檢測(cè)到超過97.15%的BUSCO基因,說明預(yù)測(cè)的完整性較高(表S13)。NR、eggNOG、GO、KEGG、TrEMBL、KOG、Swissprot和Pfam數(shù)據(jù)庫對(duì)92.16%以上的基因進(jìn)行了注釋(表S14)。共檢測(cè)到2355、4862、2852和9511個(gè)非編碼RNA(表S15)。
2.15個(gè)杜鵑屬植物泛基因組分析
杜鵑屬植物以其多樣的花朵展示而聞名,近年來,隨著第一個(gè)R. delavayi基因組的公布,一些基因組被解碼,引起了科學(xué)界的高度關(guān)注。報(bào)道了幾種杜鵑屬植物的基因組,如R. griersonianum、R. Henanense、R. Irroratum、R. kiyosumense、R. Ripense、R. Vialii、R. nivale和R. williamsianum。這些基因組為泛基因組研究奠定了基礎(chǔ)。基于這四個(gè)高質(zhì)量基因組以及11個(gè)先前發(fā)表的基因組,對(duì)杜鵑屬植物進(jìn)行了泛基因組分析(圖1F,表S16)。選擇T2T水平的R. liliiflorum基因組作為參考。該泛基因組通過添加394.57?Mb和14424個(gè)基因,擴(kuò)展了T2T水平的R. liliiflorum基因組。15個(gè)物種的基因家族數(shù)量為45731個(gè),包括5734個(gè)核心基因家族、37027個(gè)可有可無的基因家族和2970個(gè)私有基因家族(圖1G、圖S2A、表S17)。利用打亂圖分析了15個(gè)物種間基因家族共享與唯一性的關(guān)系。最后,作者基于聚類分析構(gòu)建了基因家族存在與否的分布圖(圖1H)。在2970個(gè)私有基因家族中,R.irroratum(1705)的物種特異性基因最多(表S17,圖S2B)。功能富集分析表明,“倍半萜和三萜生物合成”和“亞油酸代謝”途徑顯著富集(圖S3)。共鑒定出121185個(gè)核心基因,R. ovatum基因組的數(shù)量最多(9847)(圖S2B)。功能富集分析表明,與花的顏色和香味相關(guān)的基因途徑顯著富集,如檸檬烯和蒎烯降解(圖S4)。
3.15個(gè)杜鵑屬植物基因組的變異分析
基于以T2T基因組為參考的泛基因組分析,作者對(duì)杜鵑花的單核苷酸多態(tài)性(SNPs)、插入和缺失(InDels)以及結(jié)構(gòu)變異(SVs)等變異進(jìn)行了全面鑒定(圖1I-L,圖S5)。四倍體R. concinnum具有最多的SNP(1876446)和InDels(447281)(圖1I,表S18-19)。功能富集分析表明,含有SNPs和InDels的基因在“碳代謝”和“氨基酸生物合成”途徑中顯著富集。R. concinnum的SV數(shù)量最多,達(dá)到7694(表S20)。同時(shí),作者進(jìn)一步將SVs細(xì)分為重復(fù)(DUP)、易位(TRANS)和反轉(zhuǎn)(INV),發(fā)現(xiàn)在大多數(shù)杜鵑屬植物中,前者的數(shù)量超過后者(圖S6-7)。SVs基因與SNPs或InDels基因相比表現(xiàn)出明顯的模式,主要集中在RNA聚合酶和mRNA監(jiān)控途徑上。
4.15個(gè)杜鵑花基因組的LTR分析
該研究在15個(gè)杜鵑屬物種的全基因組中鑒定了70759個(gè)LTR,其中R. griersonianum基因組的LTR數(shù)量最多(7323)(表S21)。作者發(fā)現(xiàn),在過去的一百萬年中,大多數(shù)杜鵑花物種只經(jīng)歷了一次插入事件的爆發(fā),而R. delavayi、R. molle和R. williamsianum經(jīng)歷了兩次插入事件的爆發(fā)。兩個(gè)事件分別發(fā)生在1.53mya和2.94mya。作者對(duì)15個(gè)物種的LTR進(jìn)行聚類,得到每個(gè)聚類中的共享LTR。結(jié)果表明,共有2622個(gè)LTR聚類,其中R. platypodum最多(531個(gè))。R. liliiflorum中特異性LTRs數(shù)量最多(109個(gè)),而R. williamsianum中未發(fā)現(xiàn)物種特異性LTRs。聚類圖顯示,R.williamsianum與其他物種共享LTR的比例最高(圖1M)。此外,LTR在染色體中部的分布密度大于兩端(圖1N)。
5.15個(gè)杜鵑屬植物基因組的共線性分析
通過共線性分析,研究發(fā)現(xiàn)15個(gè)杜鵑基因組普遍表現(xiàn)出良好的共線性(圖1O)。共線性區(qū)組數(shù)從336個(gè)(R. henanense?vs?R. delavayi)到692個(gè)(R. irroratum?vs?R. prattii)。此外,還發(fā)現(xiàn)了一些基因組轉(zhuǎn)座現(xiàn)象,如R. ovatum7號(hào)染色體的末端區(qū)域與R. simsii和R. henanense。
圖 1. 4種杜鵑屬及11種已發(fā)表杜鵑屬植物的基因組分析 (A)四種杜鵑花的開花照片;(B)通過k-mer進(jìn)行基因組調(diào)查。(C)流式細(xì)胞術(shù)檢測(cè)染色體核型;(D)基因組組裝的Hi-C接觸圖;(E)轉(zhuǎn)座子、SSR、基因密度和GC含量在染色體上的分布;(F)核心(紅色)和非核心(藍(lán)色)基因家族數(shù)量趨勢(shì)圖;(G)核心集群、可有可無集群和私有集群的家族數(shù)量;(H)核心、可有可無和私有集群的存在和缺失分析;(I)百合杜鵑花基因組中基因密度、SNP和InDel變異的分布情況;(J-L)以T2T基因組為參照,研究了端粒紅豆杉、鴨嘴獸和短柄紅豆杉基因組的同源性和重排;(M)兩個(gè)物種之間共享LTR的比例(Rconc:?R. concinnum; Rdeco:?R. decorum; Rdela:?R. delavayi; Rgrie:?R. griersonianum; Rhena:?R. henanense; Rirro:?R. irroratum; Rlili:?R. liliiflorum; Rmoll:?R. molle; Rovat:?R. ovatum; Rplat:?R. platypodum; Rprat:?R. prattii; Rripe:?R. ripense; Rsims:?R. simsii; Rvial:?R. vialii; Rwill:?R. williamsianum);(N)LTR在染色體上的分布。x軸代表染色體位置的百分比,y軸代表LTR的插入時(shí)間;(O)15種杜鵑屬植物的基因組共線性。右邊的數(shù)字表示共線塊編號(hào)。
6.熱反應(yīng)基因的全轉(zhuǎn)錄組測(cè)序與檢測(cè)
為了探索杜鵑花的耐熱基因和調(diào)控機(jī)制,該研究在CK熱處理、3天熱處理(H3)和6天熱處理(H6)條件下進(jìn)行了全轉(zhuǎn)錄組測(cè)序(圖2A,表S22)。共鑒定出50648個(gè)mRNAs、17476個(gè)lncRNAs、448個(gè)miRNAs和6299個(gè)circRNAs(圖2B)。此外,在CK、H3和H6處理中,632個(gè)mRNAs、21個(gè)lncRNAs和6個(gè)miRNAs的表達(dá)和共享存在差異(圖2C)。
7.候選基因的功能驗(yàn)證
該研究選擇了兩對(duì)具有代表性的miRNAs和相關(guān)靶基因進(jìn)行功能驗(yàn)證。熱處理后3h和6h,靶基因表達(dá)顯著上調(diào),小RNA表達(dá)顯著下調(diào)。作者進(jìn)一步研究了miR177對(duì)RdbHLH153(Rhdel02G0118700)表達(dá)和miR49對(duì)RdMYB1R1(Rhdel08G0208700)表達(dá)的影響。將螢火蟲熒光素酶分別融合到RdbHLH153和RdMYB1R1的C端,并將miR49和miR177分別插入SK載體(圖2D)。結(jié)果顯示,RdbHLH153中的miR177和RdMYB1R1中的miR49的靶位點(diǎn)略有改變(圖2E)。用RdbHLH153/RdMYB1R1與空SK載體(混合并滲透)或RdbHLH153與miR177(RdMYB1R1和miR49)的混合物對(duì)煙草單葉滲透區(qū)進(jìn)行滲透。均顯示熒光素酶信號(hào)的誘導(dǎo),而R. delavayi中過表達(dá)的miR177和miR49可消除RdbHLH153/RdMYB1R1產(chǎn)生的信號(hào)(圖2E-G)。
為了進(jìn)一步研究RdbHLH153和RdMYB1R1在熱脅迫中的作用,采用花浸法獲得了過表達(dá)RdbHLH153和RdMYB1R1的轉(zhuǎn)基因擬南芥株系(表S23)。36 h熱處理后,轉(zhuǎn)基因植株的生長明顯優(yōu)于WT(圖2H)。經(jīng)過熱處理后,幼苗恢復(fù)正常狀態(tài)5天,發(fā)現(xiàn)轉(zhuǎn)基因植株轉(zhuǎn)活,WT葉片全部變黃。說明RdbHLH153和RdMYB1R1在提高耐熱性中起重要作用。DAB和NBT染色顯示,與野生型植株相比,RdbHLH153/RdMYB1R1 OE株系中H2O2和O?2的含量顯著降低(圖2I)。
圖2. miRNA和靶基因的全轉(zhuǎn)錄組分析及功能驗(yàn)證 (A)R. delavayi的對(duì)照(CK)和熱處理(H3和H6);(B)mRNA、lncRNA、miRNA和circRNA的鑒定和差異表達(dá)分析;(C)三種比較中特異性和常見的差異表達(dá)RNA;(D)效應(yīng)器和報(bào)告器結(jié)構(gòu)圖;(E)miR49和miR177靶點(diǎn)突變示意圖;(F)熒光素酶測(cè)定統(tǒng)計(jì)。誤差條表示三個(gè)重復(fù)的SEs(*,p?< 0.05)。(G)熒光素酶成像分析;(H)RdbHLH153和RdMYB1R1的過表達(dá)增強(qiáng)了耐熱性。NS表示無熱應(yīng)激,HS-A表示36 h熱應(yīng)激,HS-R表示36 h熱處理后在常溫下恢復(fù)5天;(I)二氨基聯(lián)苯胺(DAB)和硝基藍(lán)四氮唑(NBT)染色法檢測(cè)轉(zhuǎn)基因株系和WT在無熱脅迫(NS)和熱脅迫(HS)下的H2O2和O?2。
內(nèi)容來源于iMeta
]]>葡萄(Vitis)在全球范圍種植廣泛,即可鮮食又可加工成葡萄酒等,具有很高的經(jīng)濟(jì)價(jià)值,是農(nóng)民致富、鄉(xiāng)村振興、人民美好生活中不可或缺的重要園藝作物。葡萄屬于葡萄科葡萄屬植物,該屬包括兩個(gè)亞屬,麝香葡萄亞屬(Muscadinia Planch)和真葡萄亞屬(Euvitis Planch),共計(jì)70余個(gè)種;根據(jù)地理分布可將其分為三大類群,歐亞種群、北美種群和東亞種群。
葡萄作為最古老的馴化作物之一(約公元前11,000年),漫長的持續(xù)馴化和多年的育種改良導(dǎo)致現(xiàn)代葡萄品種的遺傳多樣性縮小和抗性丟失,使其易受病蟲、逆境等各種不利條件的影響。近年北美葡萄泛基因組(Genome biology, 2023),歐洲葡萄泛基因組(Nature Genetics, 2024)的相繼報(bào)道,野生葡萄以其豐富的遺傳多樣性和超強(qiáng)的抗性基因再次受到關(guān)注,但以大群體染色體級(jí)基因組組裝為基礎(chǔ),涵蓋主要品種,特別是包含東亞野生種葡萄的屬級(jí)泛基因組一直未見報(bào)道。因此構(gòu)建涵蓋整個(gè)葡萄屬的泛基因組將成為了解葡萄遺傳多樣性、開展功能基因組學(xué)研究、識(shí)別隱性遺傳特性以及葡萄精準(zhǔn)改良的關(guān)鍵資源。
該研究首先組裝了釀酒葡萄(Vitis vinifera)霞多麗的完整單倍型基因組,并首次基于ChIP-seq數(shù)據(jù)鑒定了葡萄著絲粒序列,解析著絲粒的衛(wèi)星重復(fù)序列結(jié)構(gòu)特征,發(fā)現(xiàn)單倍型著絲粒之間的顯著差異,表明其快速進(jìn)化。其次,該研究通過對(duì)591個(gè)葡萄材料的群體基因組分析,選取了72個(gè)代表性葡萄材料(包括25個(gè)野生種和47個(gè)栽培種)進(jìn)行染色體水平的單倍型基因組組裝(圖1),基因組驗(yàn)證表明這些單倍體基因組序列具有較高的質(zhì)量和完成度。
圖1-葡萄樣品全球地理分布及其果實(shí)和葉片形態(tài)
鑒于葡萄基因組因頻繁雜交而具有的高度雜合性,單倍型基因組不僅能精確解析雜合區(qū)域序列,而且對(duì)分析葡萄的育種歷史也至關(guān)重要。該研究構(gòu)建了單倍型系統(tǒng)發(fā)育進(jìn)化樹,揭示了葡萄屬植物復(fù)雜的育種歷史和豐富的遺傳多樣性。結(jié)果顯示,北美和歐洲品種存在較多內(nèi)部雜交,而東亞品種的內(nèi)部雜交較少,跨大洲雜交事件有限(圖2)。特別是東亞葡萄極少被開發(fā)的遺傳多樣性,表明了其潛在的巨大育種價(jià)值。此次發(fā)布的東亞野生葡萄基因組為葡萄遺傳育種研究提供了強(qiáng)有力的資源支持。
圖2-144個(gè)單倍型基因組系統(tǒng)發(fā)育樹
該研究還分析了72份葡萄材料的泛基因組家族,發(fā)現(xiàn)了超過6.4萬個(gè)基因家族,包括不同數(shù)量的核心、可變和私有的基因家族。擬合曲線表明,該研究的泛基因家族數(shù)量趨向飽和,表明葡萄泛基因組接近閉合。研究還系統(tǒng)分析了葡萄屬免疫受體蛋白基因家族NLR,結(jié)合三大種群的葡萄和圓葉葡萄抗霜霉病數(shù)據(jù)發(fā)現(xiàn),TIR-NBARC-LRR家族的NLR基因在抗?。ㄒ吧咸眩┖透胁∑咸眩ㄔ耘嗥咸眩┲写嬖陲@著數(shù)量差異,因此有可能是葡萄抗霜霉病表型差異的重要因素之一。該超級(jí)泛基因組分析為研究葡萄屬的遺傳多樣性、進(jìn)化歷史及功能基因挖掘提供了全面的基因組基礎(chǔ)(圖3)。
圖3-葡萄屬72份代表性材料超級(jí)泛基因組基因家族圖譜
其次,該研究進(jìn)一步繪制了目前比較完整的葡萄基因組遺傳結(jié)構(gòu)變異(SV) 圖譜,助力挖掘與抗性及資源利用效率等重要性狀相關(guān)的功能基因(圖4)。該研究通過全基因組序列比對(duì)和變異檢測(cè),在67個(gè)Euvitis葡萄樣本中鑒定出132,518個(gè)非冗余結(jié)構(gòu)變異。功能富集分析表明,這些SV與葡萄葉片形態(tài)、病原識(shí)別及生物刺激感知相關(guān)。通過與已知分子標(biāo)記的比較,該研究鑒定到霜霉病抗性分子標(biāo)記Rpv3相關(guān)SV事件,并發(fā)現(xiàn)三大種群中該SV位點(diǎn)的不同單倍型與葡萄霜霉病抗性有顯著關(guān)聯(lián)性,證明該SV是一個(gè)關(guān)鍵抗病分子標(biāo)記,突出了超級(jí)泛基因組圖譜的價(jià)值。
圖4-葡萄屬72份代表性材料結(jié)構(gòu)變異圖譜
最后,該研究使用葡萄結(jié)構(gòu)變異圖譜和基于霞多麗完整基因組序列,構(gòu)建了涵蓋歐、亞、美三大種群的圖形泛基因組?;谠搱D形泛基因組,該研究對(duì)113個(gè)葡萄樣本的霜霉病抗性表型、氣孔表型以及霜霉病侵染轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行了基因組變異的eQTL分析(圖5),鑒定出63個(gè)SV-eQTL和1,808個(gè)SNP-eQTL與葡萄抗霜霉病顯著相關(guān)。在63個(gè)與霜霉病抗性密切相關(guān)的SV的輔助下,該研究定位到一個(gè)氨基酸轉(zhuǎn)運(yùn)蛋白基因VvLHT8。進(jìn)一步的分子功能實(shí)驗(yàn)發(fā)現(xiàn)VvLHT8可能通過負(fù)調(diào)控葡萄水楊酸合成和氣孔免疫反應(yīng)進(jìn)而抑制葡萄抗病性,證實(shí)了高質(zhì)量泛基因組輔助的多組學(xué)關(guān)聯(lián)分析在作物重要農(nóng)藝性狀分子標(biāo)記開發(fā)及功能基因挖掘中的高效性。該研究構(gòu)建的葡萄屬超級(jí)泛基因組不僅加深了對(duì)葡萄生物進(jìn)化和育種改良的理解,也為精準(zhǔn)改良葡萄抗病性和多樣性提供了重要的科學(xué)基礎(chǔ)。
圖5-超級(jí)泛基因組圖譜輔助SV-eQTL鑒定及VvLHT8基因功能驗(yàn)證
該研究提供了比較全面的葡萄屬基因組資源,有助于全面解析葡萄基因組的復(fù)雜性和多樣性,從而高效發(fā)掘并利用葡萄特別是野生葡萄種中的優(yōu)異基因。該研究結(jié)合葡萄屬超級(jí)泛基因組、群體轉(zhuǎn)錄組學(xué)和表型組學(xué),對(duì)葡萄屬遺傳多樣性和重要農(nóng)藝性狀形成機(jī)制的深入探索,為未來培育超級(jí)葡萄提供了理論基礎(chǔ)和新的思路(圖6),標(biāo)志著葡萄基因組研究邁進(jìn)新的階段,也必將加速推動(dòng)我國葡萄種質(zhì)創(chuàng)新和葡萄產(chǎn)業(yè)的高質(zhì)量發(fā)展。
圖6-葡萄屬超級(jí)泛基因組構(gòu)建和應(yīng)用
以下小編列舉三篇成功案例,解析群體在QTL定位中的應(yīng)用。
當(dāng)我們針對(duì)一群體,關(guān)注性狀較多時(shí),可參照案例一,整篇文章通過群體圖譜構(gòu)建,QTL定位后幾乎沒有驗(yàn)證工作,可以幫我們拿到一個(gè)群體QTL的基礎(chǔ)數(shù)據(jù)。
發(fā)表期刊:Plant Physiology and Biochemistry
影響因子:6.1
合作單位:江蘇省徐淮區(qū)徐州農(nóng)業(yè)科學(xué)研究所農(nóng)業(yè)農(nóng)村部甘薯生物學(xué)與遺傳改良重點(diǎn)實(shí)驗(yàn)室
實(shí)驗(yàn)方法:Xin24×Yushu10雜交中選擇212個(gè)F1材料: 特異性位點(diǎn)擴(kuò)增片段測(cè)序(SLAF-seq);遺傳圖譜構(gòu)建;數(shù)量性狀位點(diǎn)(QTL)定位;GWAS關(guān)聯(lián)(F1群體)
表型檢測(cè):多年多表型收集
百邁客生物為該研究提供了群體測(cè)序及部分?jǐn)?shù)據(jù)分析服務(wù)。
甘薯作為一個(gè)全球重要的作物,其含有豐富的營養(yǎng)成分以及對(duì)不同環(huán)境的適應(yīng)能力。然而,由于其自交不親和,高雜合度等特性,使其遺傳特征的研究相對(duì)較少。作者從Xin24×Yushu10雜交中選擇212個(gè)F1材料,SLAF-seq測(cè)序,獲得親本26.73×,子代52.25×的測(cè)序數(shù)據(jù),依據(jù)SNP及百邁客生物自主研發(fā)的HighMap構(gòu)圖軟件,生成一個(gè)長度為2441.56 cM、平均圖距為0.51 cM的遺傳圖譜。
基于連鎖圖譜,鑒定出26個(gè)QTL,解釋了6.3-10%的表型變異,包括6個(gè)最長藤蔓長度 QTL、6個(gè)單株產(chǎn)量 QTL、10個(gè)干物質(zhì)含量QTL、1個(gè)淀粉含量 QTL、一個(gè)可溶性糖含量QTL和2個(gè)類胡蘿卜素含量QTL。該研究結(jié)果對(duì)甘薯的標(biāo)記輔助育種和基因克隆具有重要意義。
圖1-表型檢測(cè)
圖2-遺傳圖譜構(gòu)建
圖3-QTL定位
前文是對(duì)多個(gè)性狀的連鎖分析,當(dāng)我們關(guān)注單個(gè)性狀時(shí),BSA無疑是高性價(jià)比的初定位選擇,當(dāng)然,這就意味著我們得做到基因的精細(xì)定位與克隆,除去傳統(tǒng)圖位克隆的方式,轉(zhuǎn)錄組,蛋白組,自然群體GWAS,基因組都可助力基因克隆,如果想發(fā)高水平的文章,基因的功能探索也是必不可少的。
發(fā)表期刊:Plant Biotechnology Journal
影響因子:10.1
發(fā)表單位:河南農(nóng)業(yè)大學(xué)
實(shí)驗(yàn)方法:莢果大小/重量差異顯著2份Virginia-type花生材料( ND _ L和ND _ S)雜交,產(chǎn)生遺傳群體;F2:3群體BSA-seq(20+20混池);F6:7 和F6:8群體精細(xì)定位;基因克?。幌到y(tǒng)進(jìn)化分析;亞細(xì)胞定位;免疫熒光;酵母雙雜交;pull-down;CO-IP;番茄擬南芥轉(zhuǎn)化實(shí)驗(yàn)等。
百邁客生物為該研究提供了群體測(cè)序及部分?jǐn)?shù)據(jù)分析服務(wù)。
花生莢果大小是決定花生產(chǎn)量的關(guān)鍵農(nóng)藝性狀,為了鑒定控制花生莢果大小的基因,該研究對(duì)188份核心種質(zhì)進(jìn)行鑒定,并選取莢果大小/重量差異顯著的2份花生材料構(gòu)建F2群體,BSA-Seq獲得了288.58 Gb的原始數(shù)據(jù)。利用285914個(gè)高質(zhì)量SNPs 和70 759個(gè) InDel,將控制莢果大小的基因定位在07染色體1.17 Mb的區(qū)間內(nèi)。作者從F6:7和F6:8群體中開發(fā)了15個(gè)多態(tài)性標(biāo)記并對(duì)個(gè)體進(jìn)行基因分型,精細(xì)定位QTL到KASP 9 和In Del15之間20.4 kb的區(qū)間內(nèi)。該區(qū)間僅包含1個(gè)預(yù)測(cè)的非同義突變基因和InDels,將該基因命名為PSW1。
PSW1編碼一個(gè)LRR – RLK蛋白激酶,等位基因PSW1HapII賦予了PSW1更高的表達(dá)水平和對(duì)其輔助受體AhBAK1更強(qiáng)的親和力,以上調(diào)PSW1 – based途徑,調(diào)節(jié)花生莢果大小。此外,PSW1HapII的過表達(dá)增加了多種植物的種子/果實(shí)大小。
圖4-表型檢測(cè)
圖5-BSA分析
當(dāng)然,如果想讓我們的文章影響因子再上一臺(tái)階,兼顧群體的“廣度”和“深度”,是更好的選擇。
發(fā)表期刊:Nature?Genetics
影響因子:30.8
發(fā)表單位:浙江省農(nóng)業(yè)科學(xué)院等
實(shí)驗(yàn)方法:菜用豇豆G98,糧用豇豆G323 基因組Denovo;重測(cè)序GWAS:344份全世界收集的豇豆核心種質(zhì),其中包括342份栽培豇豆(87份糧用豇豆、244份菜用豇豆和11份未知用途豇豆)和2份野生豇豆;Illumina測(cè)序,10x深度;基因單倍型驗(yàn)證:菜用豇豆地方品種 ‘ZN016’ 和菜用豇豆育成品種‘Zhijiang282構(gòu)建的RIL群體(183 lines)G98和G323構(gòu)建的F2群體(165 individuals)
百邁客生物為該研究提供了群體測(cè)序、基因組測(cè)序及部分?jǐn)?shù)據(jù)分析服務(wù)。
豇豆起源于非洲,在世界范圍內(nèi)作為糧食、蔬菜或牲畜飼料種植。該研究結(jié)合PacBio、Hi-C和二代測(cè)序,組裝了糧用豇豆和菜用豇豆的染色體水平基因組。對(duì)包括地方品種、野生品種和育成品種的344個(gè)材料進(jìn)行二代測(cè)序,以闡明豇豆基因組的系統(tǒng)進(jìn)化。
為了研究自然或人工選擇對(duì)豇豆分化的影響,作者通過選擇清除分析比較了三個(gè)豇豆亞群之間的基因組選擇特征,鑒定出239個(gè)與豇豆馴化和改良相關(guān)的基因。此外,通過GWAS,挖掘到裂莢性、莢長、單莢粒數(shù)、千粒重、可溶性糖、總淀粉和粗蛋白質(zhì)含量相關(guān)基因,并在遺傳群體中驗(yàn)證。同時(shí)揭示了兩個(gè)亞種之間基因組結(jié)構(gòu)變異(SVs)的全圖譜,為豇豆在全基因組選擇下的馴化與改良提供了見解。產(chǎn)量性狀和品質(zhì)性狀的差異基因組選擇將有助于建立糧用豇豆和菜用豇豆雙向改良的遺傳資源。
圖6-群體選擇與GWAS分析
今日分享結(jié)束,期待下期精彩內(nèi)容~~~
]]>
文章標(biāo)題:Chromosome-level genome assemblies of two littorinid marine snails indicate genetic basis of intertidal adaptation and ancient karyotype evolved from bilaterian ancestors
合作單位:中國科學(xué)院海洋研究所
發(fā)表期刊:GigaScience
影響因子:11.8
研究對(duì)象:短濱螺和中華濱螺
百邁客生物為該研究提供了基因組測(cè)序服務(wù)。
濱螺棲息于巖相潮間帶,受到海洋和陸地環(huán)境的雙重影響,需要根據(jù)潮水漲落的節(jié)律適應(yīng)水生和陸生兩種完全不同的生境,其廣布性、高豐度和對(duì)于環(huán)境因子脅迫多樣且高變動(dòng)的潮間帶環(huán)境良好的適應(yīng)性,使其成為研究環(huán)境適應(yīng)、生物進(jìn)化和物種形成的潛在模式生物,也是探究生物對(duì)于環(huán)境壓力變化快速響應(yīng)機(jī)制的優(yōu)良范本,相關(guān)的生物學(xué)、分類學(xué)、系統(tǒng)發(fā)育學(xué)和生態(tài)學(xué)研究已經(jīng)大量開展。此外,細(xì)胞遺傳學(xué)研究結(jié)果顯示,濱螺具有17條染色體,與兩側(cè)對(duì)稱動(dòng)物的祖先染色體(ALG)數(shù)目一致,因此推演二者之間的核型演化歷程具有重要的進(jìn)化生物學(xué)意義。然而由于基因組測(cè)序和組裝技術(shù)的限制,目前濱螺科基因組資源十分匱乏,極大地阻礙了相關(guān)研究的順利開展。
該研究基于三代長讀長測(cè)序、二代測(cè)序和Hi-C測(cè)序數(shù)據(jù),構(gòu)建了短濱螺和中華濱螺染色體水平基因組參考序列,并完成了基因結(jié)構(gòu)和功能注釋。組裝得到兩種濱螺基因組大小在900Mb左右,contig N50為3.43Mb和2.31Mb,并成功掛載到17條染色體上,BUSCO評(píng)估得分均在93%以上。兩個(gè)濱螺高質(zhì)量基因組參考序列作為重要的基因組資源,對(duì)于濱螺科及軟體動(dòng)物門系統(tǒng)發(fā)育、進(jìn)化基因組學(xué)和生態(tài)學(xué)等研究都具有十分重要的意義。
通過比較基因組學(xué)分析構(gòu)建了包括兩種濱螺在內(nèi)的11個(gè)物種的系統(tǒng)發(fā)育樹,并估算兩種濱螺的分化時(shí)間大約在128.22Mya前。進(jìn)一步的研究結(jié)果表明與刺激反應(yīng)、代謝過程、先天免疫和抗氧化反應(yīng)相關(guān)的基因或基因家族可能在濱螺應(yīng)對(duì)潮間帶多種環(huán)境因子脅迫的過程中發(fā)揮著重要作用,受損核酸和蛋白的修復(fù)或降解可能是濱螺在多重壓力下抵抗細(xì)胞凋亡、維持細(xì)胞內(nèi)穩(wěn)態(tài)的主要方式。相關(guān)研究結(jié)果為潮間帶無脊椎動(dòng)物適應(yīng)性進(jìn)化分子機(jī)制的后續(xù)研究提供了基礎(chǔ)。
圖1-11個(gè)物種系統(tǒng)發(fā)育樹
宏觀共線性分析結(jié)果表明濱螺17條染色體可能由17條ALG經(jīng)過4次染色體分裂和4次染色體融合演化而來,并推演了由ALG演化到雙殼-腹足共同祖先再到濱螺和扇貝的簡約演化歷程,表明兩側(cè)對(duì)稱動(dòng)物祖先的基因連鎖群在經(jīng)過上億年的演化之后在現(xiàn)存物種中仍然得以保留,為未來雙殼-腹足共同祖先核型的構(gòu)建和核型進(jìn)化速率影響因素的研究提供了參考。
圖2-短濱螺、中華濱螺和蝦夷扇貝兩兩間宏觀共線性散點(diǎn)圖
圖3-簡約核型演化歷程推演及濱螺和扇貝共同祖先(MRCA of PY &Ls)核型構(gòu)建
內(nèi)容來源于中國科學(xué)院海洋研究所
]]>文章通過構(gòu)建本氏煙草端粒到端粒無缺口基因組,對(duì)本氏煙草進(jìn)行了亞基因組分型,進(jìn)一步確定林煙草(N. sylvestris)和漸狹葉煙草(N. attenuata)最可能是其二倍體祖先物種。研究還深入解析了異源四倍體本氏煙草的著絲粒序列及其表觀特征,豐富了我們對(duì)本氏煙草基因組進(jìn)化和著絲粒演化過程的認(rèn)識(shí)。
文章標(biāo)題:The complete genome assembly of?Nicotiana benthamiana?reveals the genetic and epigenetic landscape of centromeres
合作單位:北京大學(xué)現(xiàn)代農(nóng)業(yè)研究院
發(fā)表期刊:Nature Plants
研究對(duì)象:本氏煙草
百邁客生物為該研究提供了PacBio HiFi、Hi-C、Illumina和RNA-seq測(cè)序服務(wù)。
本氏煙草(Nicotiana benthamiana)是一年生茄科煙草屬植物,原產(chǎn)于澳大利亞北部地區(qū),和用于制作香煙的普通煙草(N. tabaccum)是近緣物種。本氏煙草最為人知的是作為植物學(xué)和合成生物學(xué)研究的模式植物。本氏煙草憑借其對(duì)病毒的易感性和在瞬時(shí)基因表達(dá)的便利性成為了植物科學(xué)家的“寵兒”,同時(shí)它也是植物天然產(chǎn)物和疫苗異源合成的重要底盤生物。因此,解析本氏煙草的基因組密碼對(duì)促進(jìn)植物科學(xué)研究和生物制藥產(chǎn)業(yè)具有重要的價(jià)值。本氏煙草是異源四倍體,由兩個(gè)二倍體祖先在距今500萬年-600萬年雜交形成,之后基因組演化形成現(xiàn)今的19對(duì)染色體。本氏煙草基因組約為2.85Gb,其草圖最早發(fā)表于2012年,之后的12年間多個(gè)改進(jìn)版本的本氏煙草基因組陸續(xù)公布,組裝質(zhì)量有了很大提升,但仍然存在多個(gè)缺口與組裝注釋錯(cuò)誤,嚴(yán)重影響了對(duì)這一模式生物的功能基因組學(xué)的研究進(jìn)程。
著絲粒是負(fù)責(zé)細(xì)胞分裂過程中染色體平均分配給子細(xì)胞的基因組關(guān)鍵區(qū)域,也被稱為基因組的暗物質(zhì)區(qū)域。因其高度復(fù)雜并富含重復(fù)序列,著絲粒的序列很難被測(cè)序和破譯。近年來隨著測(cè)序技術(shù)和生物信息算法的快速發(fā)展,包括人類、擬南芥、酵母在內(nèi)的多個(gè)模式生物以及玉米、水稻、辣椒、生菜等作物的著絲粒特征逐漸被揭示。這豐富了我們對(duì)這些基因組暗物質(zhì)的認(rèn)知,為疾病研究和治療、作物單倍體育種、人工染色體合成等前沿科學(xué)提供理論指導(dǎo)。然而,我們對(duì)生物界著絲粒的結(jié)構(gòu)和進(jìn)化理解仍然處在初期,絕大多數(shù)生物的著絲粒區(qū)域仍未解析。此外,多倍體生物例如四倍體本氏煙草、四倍體馬鈴薯、六倍體小麥等,基因組經(jīng)歷了復(fù)制、重排和結(jié)構(gòu)變異等事件,在此過程中著絲粒如何演化和維持功能也有待闡明。異源四倍體的本氏煙草為這些問題的解答提供了一個(gè)理想的模型。
研究團(tuán)隊(duì)首先采用單分子測(cè)序技術(shù)(HiFi,116.7x?+ ONT ultra-long,47.9x),Hi-C(150x)和Bionano(329.6x)光學(xué)圖譜等多種技術(shù)相結(jié)合策略,構(gòu)建了T2T無缺口的本氏煙草基因組(2.85 Gb),實(shí)現(xiàn)所有染色體的完整分型組裝(圖1),并鑒定到所有19個(gè)著絲粒和38個(gè)端粒,contig N50值達(dá)到146.4 Mb。隨后的質(zhì)量評(píng)估表明該基因組具有很高的堿基準(zhǔn)確性和組裝完整性。
圖1-本氏煙草T2T基因組全局特征、多倍體進(jìn)化歷史和著絲粒演化進(jìn)程
研究團(tuán)隊(duì)還進(jìn)一步基于著絲粒特異結(jié)合蛋白CENH3的ChIP-seq數(shù)據(jù),確定了本氏煙草基因組的完整著絲粒序列,并揭示了其著絲粒全景特征。令人驚訝的是,與辣椒和馬鈴薯等茄科作物的著絲粒(以LTR/Gypsy反轉(zhuǎn)錄轉(zhuǎn)座子為主)不同,本氏煙草著絲粒不僅有Gypsy序列,而且存在大量的衛(wèi)星(Satellite)DNA的重復(fù)陣列,暗示這些著絲粒特異的衛(wèi)星重復(fù)序列是在本氏煙草中新出現(xiàn)的(圖2)。經(jīng)過仔細(xì)分析,研究團(tuán)隊(duì)證明了本氏煙草著絲粒衛(wèi)星陣列可能起源于核糖體DNA的基因間間隔序列。
此外,在著絲粒組蛋白CENH3優(yōu)先占據(jù)的區(qū)域,Gypsy反轉(zhuǎn)錄轉(zhuǎn)座子和核基因組線粒體插入序列(NUMT)廣泛侵入本氏煙草著絲粒,表明這些DNA元件在著絲粒功能中起著至關(guān)重要的作用。有趣的是,NUMT在本氏煙草著絲粒中的插入具有很強(qiáng)的亞基因組偏好性,并且主要與母體著絲粒周圍有關(guān)。亞基因組分析表明,衛(wèi)星陣列的出現(xiàn)可能推動(dòng)了多倍體后著絲粒的形成(圖2)。
最后,該研究提出一個(gè)模型來解釋本氏煙草著絲粒的進(jìn)化,即本氏煙草基因組在多倍化后通過新著絲粒形成、衛(wèi)星序列擴(kuò)展、反轉(zhuǎn)錄轉(zhuǎn)座子的富集和NUMT整合而實(shí)現(xiàn)著絲粒進(jìn)化(圖1),豐富了我們對(duì)于茄科植物和多倍體植物著絲粒演化的認(rèn)知。
圖2-本氏煙草著絲粒衛(wèi)星重復(fù)序列推動(dòng)新著絲粒的形成和進(jìn)化
該研究公布了模式植物本氏煙草的T2T無缺口基因組,并揭示了其著絲粒的全景結(jié)構(gòu)及其表觀遺傳特征,該研究成果具有里程碑意義。本氏煙草完整基因組的破譯不但為植物科學(xué)研究提供了重要的遺傳資源,也將促進(jìn)本氏煙草作為模式和底盤植物在生物技術(shù)領(lǐng)域的廣泛應(yīng)用。
內(nèi)容來源于北京大學(xué)現(xiàn)代農(nóng)業(yè)研究院,侵刪
]]>發(fā)表期刊:Poultry Science
影響因子:3.8
發(fā)表單位:南京農(nóng)業(yè)大學(xué),西藏農(nóng)牧學(xué)院等
研究對(duì)象:金陵白鴨
研究方法:全基因組關(guān)聯(lián)分析(GWAS)
百邁客生物為該研究提供了全基因組關(guān)聯(lián)分析(GWAS)測(cè)序及部分?jǐn)?shù)據(jù)分析服務(wù)。
鴨子為人類消費(fèi)提供肉、蛋、羽毛等產(chǎn)品,中國是世界上最大的鴨肉消費(fèi)國。金陵白鴨做為我國優(yōu)質(zhì)的選育品種,具有優(yōu)良的生長速度和肉質(zhì)品質(zhì)。從孵化到上市的整個(gè)時(shí)期,鴨子的體重逐漸增加,這一過程由復(fù)雜的生理和生化機(jī)制調(diào)控,器官和骨骼的發(fā)育是體重增加的關(guān)鍵因素,全基因組關(guān)聯(lián)分析(GWAS)是許多牲畜和家禽物種研究生長和發(fā)育的遺傳機(jī)制的常用方法,然而,現(xiàn)有的一些關(guān)于鴨生長發(fā)育性狀的GWAS研究測(cè)序深度較低,發(fā)現(xiàn)的候選基因很少。
201只雄鴨全基因組測(cè)序深度為10×;
GWAS分析:表型:出生體重(BWB)、1周體重(BW1)、3周體重(BW3)、5周體重(BW5)和7周體重(BW7)分析模型:FaST-LMM;EMMAX;LMM;LM 閾值線:log10(p)=5如果一個(gè)SNP在2個(gè)或更多的模型中被關(guān)聯(lián),作者認(rèn)為它是一個(gè)與特定性狀相關(guān)的高可信度SNP。
進(jìn)化分析:進(jìn)化樹構(gòu)建;群體結(jié)構(gòu)分析;PCA分析;LD衰減分析等
1.金陵白鴨群體體重表型統(tǒng)計(jì)
該研究對(duì)金陵白鴨(n = 201)在不同時(shí)期的體重進(jìn)行統(tǒng)計(jì),BWB、BW1、BW3、BW5和BW7的體重均值分別為46.93g、127.19g、697.17g、1182.43g和1,888.52g。生長曲線結(jié)果顯示:金陵白鴨第3周-第5周生長最快,第5周后生長放緩。體重的分散度隨著年齡和體重的增加而增加。相鄰2周的體重之間存在較強(qiáng)的相關(guān)性,BW3與BW1(r = 0.6)、BW5(r = 0.68)和BW7(r = 0.6)顯著正相關(guān),BW5與BW7顯著正相關(guān)(r = 0.82)。但隨著時(shí)間間隔的延長,性狀間的相關(guān)性降低,BW1與BW7的相關(guān)性不顯著(r = 0.21),BWB則與BW3 (r = 0.18), BW5 (r = 0.058),BW7 (r = 0.45)均不顯著相關(guān)。
圖1-表型分析
2.金陵白鴨系統(tǒng)發(fā)育、群體遺傳結(jié)構(gòu)解析
雖然該研究只有金陵白鴨一個(gè)種群,但考慮到繁殖過程中種群分層的潛力,作者進(jìn)行了系統(tǒng)發(fā)育和群體結(jié)構(gòu)分析。系統(tǒng)發(fā)育樹和PCA結(jié)果顯示,金陵白鴨可分為5個(gè)種群,群體結(jié)構(gòu)表明,當(dāng)K=6時(shí)分群結(jié)果最佳,金陵白鴨種群具有豐富的遺傳多樣性,總SNPs的平均R2為0.24,當(dāng)R2=0.2,LD的衰減距離約為30kbp。
圖2-群體進(jìn)化分析
3.GWAS分析
該研究對(duì)基于測(cè)序產(chǎn)生的2,610.50 Gbp的clean data進(jìn)行分析,Q30為95.55%,樣本與參考基因組平均比對(duì)率為99.59%,平均覆蓋深度為10×,基因組覆蓋度為96.51%。作者利用,797,309,337個(gè)SNPs,4種關(guān)聯(lián)模型進(jìn)行后續(xù)GWAS分析,其中95個(gè)SNP與BWB性狀顯著相關(guān),這些SNP主要分布在1號(hào)染色體和4號(hào)染色體上。通過篩選和注釋,共檢測(cè)到5個(gè)相關(guān)的候選基因:PUS7、FBXO11、FOXN2、MSH6、SLC4A4。針對(duì)BW1性狀,作者發(fā)現(xiàn)了101個(gè)與BW1性狀顯著相關(guān)的SNPs,這些SNP主要分布在7號(hào)染色體上,共檢測(cè)到2個(gè)與BW1性狀相關(guān)的候選基因:RAG2和TMEFF2。針對(duì)BW3性狀,作者發(fā)現(xiàn)了112個(gè)顯著SNPs。這些SNP主要分布在1號(hào)染色體和11號(hào)染色體上。通過篩選和注釋,共檢測(cè)到4個(gè)與BW3性狀相關(guān)的候選基因:?STARD13、Klotho、ZAR1L和TLE3。同時(shí)確定了92個(gè)與BW5性狀相關(guān)SNPs,這些SNP主要分布在1號(hào)染色體和2號(hào)染色體上,通過注釋STARD13、Klotho和ZAR1L與BW5性狀相關(guān)。此外,作者還鑒定了新的候選基因:KAT2B、KCNH8和SATB1。
BW7性狀與33個(gè)SNP關(guān)聯(lián),這些SNP主要分布在1號(hào)染色體和2號(hào)染色體上。通過篩選和注釋,共檢測(cè)到6個(gè)與BW7性狀相關(guān)的候選基因:PLXNC1、ATP1A1、CD58、FRYL、OCIAD1和OCIAD2。在分析的四個(gè)模型的結(jié)果,LM識(shí)別出了更多的顯著位點(diǎn),曼哈頓圖顯示出更高的峰值。然而,QQ-plot顯示,LM模型中的大部分站點(diǎn)都位于對(duì)角線上方,可能具有較高的假陽性。其余3個(gè)模型的結(jié)果均表現(xiàn)出一致性,而QQ-plot的結(jié)果則優(yōu)于LM模型。
圖3-GWAS分析
金陵白鴨是一種新開發(fā)的品種,因其生長速度快,肉質(zhì)優(yōu)良的特點(diǎn),使其具有重要的經(jīng)濟(jì)價(jià)值和研究潛力;然而,人們對(duì)其體重性狀的遺傳基礎(chǔ)尚不太清楚。該研究對(duì)201只金陵白公鴨進(jìn)行了全基因組重測(cè)序,并進(jìn)行了群體基因組分析,表明金陵白鴨種群具有豐富的遺傳多樣性。
作者對(duì)出生體重(BWB)、1周體重(BW1)、3周體重(BW3)、5周體重(BW5)和7周體重(BW7)進(jìn)行了全基因組關(guān)聯(lián)分析,4種統(tǒng)計(jì)模型比較研究表明,F(xiàn)aST-LMM表現(xiàn)出最優(yōu)的效率,產(chǎn)生更多的結(jié)果和最小的假陽性。
作者發(fā)現(xiàn),PUS7、FBXO11、FOXN2、MSH6和SLC4A4均與BWB相關(guān)。RAG2和TMEFF2是BW1的候選基因,STARD13、Klotho、ZAR1L可能是BW3和BW5的候選基因。PLXNC1、ATP1A1、CD58、FRYL、OCIAD1和OCIAD2與BW7相關(guān)。這些研究結(jié)果為金陵白鴨的選擇和育種提供了遺傳參考,同時(shí)也加深研究者們對(duì)白鴨生長發(fā)育表型的認(rèn)識(shí)。
]]>期刊名稱:Nature Genetics
合作單位:北京大學(xué)現(xiàn)代農(nóng)業(yè)研究院
發(fā)表時(shí)間:2024年7月8日
影響因子:31.7
研究對(duì)象:西瓜
測(cè)序技術(shù):HIC測(cè)序
百邁客生物為該研究提供HIC等建庫測(cè)序服務(wù)。
泛基因組是一個(gè)物種中所有個(gè)體基因組信息的總和,構(gòu)建泛基因組可以有效解決單一參考基因組帶來的信息缺失和分析偏差。而超級(jí)泛基因組則代表一個(gè)屬內(nèi)所有物種的基因組信息,尤其蘊(yùn)含了野生種中豐富的基因組變異,是對(duì)泛基因組的進(jìn)一步擴(kuò)展,在遠(yuǎn)緣雜交和基因發(fā)掘等方向具有重要應(yīng)用前景。
西瓜是世界重要的園藝經(jīng)濟(jì)作物之一,富含抗氧化劑番茄紅素和增強(qiáng)血液循環(huán)的瓜氨酸,口味甘甜,享有夏季”水果之王”的美譽(yù),深受全球消費(fèi)者喜愛。西瓜全球年產(chǎn)量接近1億噸,我國作為種瓜和吃瓜第一大國,生產(chǎn)和消費(fèi)了全球總量的60%以上,西瓜產(chǎn)業(yè)在鄉(xiāng)村振興和農(nóng)民致富中占有十分重要的作用。我國西瓜產(chǎn)業(yè)的迅速發(fā)展離不開優(yōu)良的品種?,依靠一代代育種家的不懈努力,我國成為世界上西瓜種質(zhì)創(chuàng)新和品種選育最為活躍的國家,在品種種源方面實(shí)現(xiàn)了完全自主可控。隨著氣候變化的加劇和病蟲危害的日益嚴(yán)重,西瓜生產(chǎn)面臨著嚴(yán)重的挑戰(zhàn)。在現(xiàn)有優(yōu)良品種的基礎(chǔ)上,“植入”缺少的抗病耐逆優(yōu)良基因,是西瓜種質(zhì)創(chuàng)新的關(guān)鍵問題,對(duì)維持我國西瓜產(chǎn)業(yè)高質(zhì)量綠色發(fā)展十分重要。栽培西瓜在馴化和品種改良過程中因?yàn)閷?duì)品質(zhì)和產(chǎn)量的追求,導(dǎo)致遺傳多樣性非常狹窄,抗病耐逆基因大量丟失,而在西瓜的祖先即野生西瓜中存在廣泛的遺傳與表型多樣性,具有豐富的抗病耐逆等基因資源,是西瓜遺傳改良和種質(zhì)創(chuàng)新的寶庫。
2024年7月8日,北京大學(xué)現(xiàn)代農(nóng)業(yè)研究院在國際頂尖期刊《自然-遺傳學(xué)》上在線發(fā)表了題為Telomere-to-telomere?Citrullus?Super-pangenome Provides Direction for Watermelon Breeding的研究成果,是西瓜科研領(lǐng)域的重大突破。
該研究繪制了西瓜屬全部7個(gè)種的28份代表性材料的端粒到端粒(T2T)高質(zhì)量基因組圖譜,成功構(gòu)建屬級(jí)T2T水平超級(jí)泛基因組。得到總計(jì)768.5Mb,32,513個(gè)基因家族的西瓜屬泛基因組,是單個(gè)西瓜基因組的1.5倍,增加了11,225個(gè)栽培西瓜中沒有發(fā)現(xiàn)的基因?;赥2T高質(zhì)量基因組圖譜,該研究全面比較了西瓜屬的著絲粒序列,其豐富的變異和特有的進(jìn)化關(guān)系影響了不同種之間的雜交配對(duì)。因此,該超級(jí)泛基因組極大地?cái)U(kuò)展了西瓜遺傳改良的基因池。(圖1)
圖1-西瓜屬7個(gè)種的28份代表性材料的多樣性與泛基因組圖譜
利用基因組序列,該研究拓展了西瓜屬的分類系統(tǒng),核實(shí)了西瓜起源于非洲的理論依據(jù),并發(fā)現(xiàn)栽培西瓜除之前報(bào)道的cordophanus亞種外可能還存在其他祖先。另外,我們?cè)谖鞴蠈賰?nèi)發(fā)現(xiàn)了三次重大染色體重排事件和兩個(gè)超長片段倒位。這些染色體重排顯著影響了西瓜的抗性、品質(zhì)相關(guān)基因以及三維基因組結(jié)構(gòu),并在栽培種中得以保留。同時(shí),這些發(fā)現(xiàn)也為回交育種過程中避免連鎖累贅提供了基因組基礎(chǔ)。(圖2)
圖2-西瓜屬進(jìn)化與栽培西瓜的起源
該超級(jí)泛基因組鑒定出西瓜屬超過461,987個(gè)SV,構(gòu)建了西瓜圖形泛基因組。該研究通過SV-GWAS鑒定了馴化過程中丟失和獲得的關(guān)鍵基因,挖掘了與葫蘆素含量、含糖量、果肉著色等重要性狀相關(guān)的功能基因結(jié)構(gòu)變異,發(fā)現(xiàn)在西瓜馴化過程中,伴隨著多個(gè)與甜度增加、果肉變紅相關(guān)的基因簇?cái)U(kuò)張,大量抗病功能相關(guān)的基因簇丟失。該研究為西瓜育種家提供了較完整的基因組資源,助力深入理解西瓜基因組的復(fù)雜性和多樣性,從而高效挖掘和利用野生西瓜種中的有利基因。(圖3)
圖3-西瓜屬重要性狀基因結(jié)構(gòu)變異圖譜
最后,該研究利用野生西瓜的基因組序列和抗病基因信息,通過種間雜交選育形成了抗多種病害的自交系‘PKR6’,并有效確定了西瓜抗枯萎病生理小種候選基因。該研究提供了利用野生種質(zhì)創(chuàng)制優(yōu)異育種材料的范例,從而將馴化過程中丟失的抗病基因重新有目的地導(dǎo)入栽培種中改良種質(zhì),對(duì)加速抗病品種選育、促進(jìn)西瓜產(chǎn)業(yè)高效發(fā)展具有深遠(yuǎn)意義。(圖4)
圖4-遠(yuǎn)緣雜交創(chuàng)制優(yōu)良抗病種質(zhì)PKR6基因組及枯萎病抗性表型
西瓜屬端到端超級(jí)泛基因組是較高質(zhì)量較全面的西瓜屬基因組序列圖譜和變異圖譜,它揭示了西瓜屬的基因組演化歷史,發(fā)掘了西瓜野生種中豐富的遺傳多樣性,提供了利用野生種質(zhì)創(chuàng)制優(yōu)異育種材料的新范例,為其他作物超級(jí)泛基因組的構(gòu)建和野生種質(zhì)的利用指明了方向。
內(nèi)容來源于北京大學(xué)現(xiàn)代農(nóng)業(yè)研究院,侵刪
]]>文章標(biāo)題:Assembly of high-quality genomes of the locoweed?Oxytropis ochrocephala?and itsendophyte?Alternaria oxytropis?provides new evidence for their symbiotic rela-tionship and swainsonine biosynthesis
期刊名稱:Molecular Ecology Resources
研究物種:黃花棘豆
研究方法:基因組、轉(zhuǎn)錄組、重測(cè)序、代謝組
百邁客生物為其提供了基因組測(cè)序及組裝技術(shù)服務(wù)。
黃花棘豆(Oxyvropis ochrocephala Bunge)隸屬于豆科棘豆屬,為二倍體(2n=16)多年生植物,是我國草原危害最大的毒害草之一。其能夠與內(nèi)生真菌棘豆鏈格孢菌Alfernaria oxytropis共生,因該內(nèi)生真菌合成生物堿苦馬豆素(swainsonine,SW)而使植株帶有毒性,牲畜誤食后導(dǎo)致中毒甚至死亡,對(duì)畜牧業(yè)發(fā)展造成了嚴(yán)重影響。
基因組:黃花棘豆;253.39 Gb Illumina+301.02 Gb Nanopore+330.17Gb Hi-C;棘豆鏈格孢菌;4.40 Gb Illumina+10.09 Gb Nanopore;
轉(zhuǎn)錄組:黃生棘豆無菌幼苗、黃生棘豆及其內(nèi)生菌共生苗、棘豆鏈格孢菌;每個(gè)材料3個(gè)生物學(xué)重復(fù);
重測(cè)序:從中國3個(gè)省13個(gè)地理位置采集的黃花棘豆中分離的41株棘豆鏈格孢菌;19x:代謝組:LC-MS;
代謝組:41株棘豆鏈格孢菌苦馬豆素含量測(cè)定
1.黃花棘豆及A.oxytropis基因組組裝注釋
作者利用三代Nanopore、二代Illumina測(cè)序技術(shù)以及Hi-C技術(shù)測(cè)序組裝獲得一個(gè)高質(zhì)量染色體水平的黃花棘豆基因組:其基因組大小為930.94 Mb,contig N50為1.40 Mb,scaffold N50為121.79 Mb,共注釋到31,700個(gè)蛋白質(zhì)編碼基因。利用三代Nanopore和二代Illumina測(cè)序技術(shù)測(cè)序組裝獲得一個(gè)高質(zhì)量的棘豆鏈格孢菌基因組:其基因組大小為74.48 Mb,contig N50為8.87Mb,共注釋到10,657個(gè)蛋白質(zhì)編碼基因。
2.黃花棘豆及A.oxytropis基因組進(jìn)化和全基因組復(fù)制分析
黃花棘豆基因組進(jìn)化分析顯示,其大約于42.62百萬年前分化出來,且與蒺藜苜蓿、大豆具有較近的親緣關(guān)系。黃花棘豆與蒺藜苜蓿之間基因的共線性關(guān)系更好,但染色體發(fā)生了部分片段的重排,這些重排的基因主要參與代謝途徑。黃花棘豆基因組中6,938個(gè)基因家族發(fā)生收縮,1,862個(gè)基因家族發(fā)生擴(kuò)張,在進(jìn)化過程中發(fā)生了一次WGD事件。A.oxytropis基因組進(jìn)化分析顯示,A.oxytropis與同屬的其他真菌聚在一起,與不同屬中產(chǎn)苦馬豆素的真菌相比,A.oxytropis具有該物種最豐富的特有基因家族,主要與代謝途徑相關(guān)。基于SW合成基因簇的關(guān)鍵基因swnK的系統(tǒng)進(jìn)化分析發(fā)現(xiàn),有14個(gè)目的真菌均含有該基因簇。基于ITS系統(tǒng)進(jìn)化分析發(fā)現(xiàn),Altemaria屬內(nèi)產(chǎn)苦馬豆素(含有swnK基因)的物種聚在一起,與不含swnK基因的物種分離。
圖1.黃花棘豆與其他10個(gè)物種的比較基因組學(xué)分析
3.黃花棘豆與A.oxytropis基因表達(dá)
黃花棘豆與A.oxytropis共生/非共生狀態(tài)下的轉(zhuǎn)錄組分析顯示,對(duì)寄主而言,其與內(nèi)生真菌共生后差異基因主要與防御以及次級(jí)代謝相關(guān);對(duì)內(nèi)生真菌而言,其在寄主體內(nèi)共生時(shí),參與脂肪酸代謝、氮代謝以及降解細(xì)胞壁相關(guān)的差異基因被大量誘導(dǎo)上調(diào)表達(dá),同時(shí)共生誘導(dǎo)了大量SW合成基因的上調(diào)表達(dá)。
4.A.oxytropis遺傳變異影響苦馬豆素含量
該研究豐富了前期推測(cè)的SW合成通路,進(jìn)一步分析顯示,一個(gè)編碼P5CR的基因位于SWN簇上,也包含在SWN的全長序列中。對(duì)從中國3個(gè)省13個(gè)地理位置采集的黃花棘豆種分離的41株A.oxytropis的重測(cè)序分析顯示,一個(gè)位點(diǎn)SNP19996與SW含量相關(guān)。
圖2.SW基因表達(dá)、基因結(jié)構(gòu)以及SWN基因簇中SNP多樣性、A.oxytropis體內(nèi)SW含量
作者構(gòu)建了高質(zhì)量黃花棘豆基因組(958.83Mb),及其共生真菌A.oxytropis基因組(74.48Mb,contig N508.87Mb),并對(duì)SW生物合成基因進(jìn)行了細(xì)化。41株A.oxytropis的重測(cè)序分析找到與SW含量相關(guān)位點(diǎn),轉(zhuǎn)錄組分析發(fā)現(xiàn)了與宿主的防御和次級(jí)代謝相關(guān)的差異表達(dá)基因(DEGs)。在內(nèi)生菌中,DEGs與細(xì)胞壁降解、脂肪酸和氮代謝有關(guān)。共生關(guān)系誘導(dǎo)了大部分SW生物合成基因的上調(diào)。
]]>文章標(biāo)題:Chromosome-scale genome assembly clarifies the mechanism of flooding tolerance and evolutionary?history of?Myricaria laxiflora
期刊名稱:Industrial Crops & Products
合作單位:西南大學(xué)、重慶市林業(yè)科學(xué)研究院、重慶城市管理職業(yè)學(xué)院
研究物種:疏花水柏枝
研究方法:基因組學(xué)
百邁客生物為該研究提供了基因組測(cè)序和部分分析工作。
疏花水柏枝(Myricaria laxiflora),檉柳科,是長江流域天然存在的寶貴植物資源,對(duì)淹沒的棲息地具有較好的適應(yīng)性,每年可以忍受大約五個(gè)月的淹沒。洪水對(duì)植物的生長、發(fā)育和產(chǎn)量產(chǎn)生負(fù)面影響,嚴(yán)重時(shí)可能導(dǎo)致死亡。全球氣候變化使洪水更加常見和嚴(yán)重。研究疏花水柏枝對(duì)極端洪澇環(huán)境的適應(yīng)機(jī)制,尋找關(guān)鍵功能基因,為種質(zhì)改良提供理論和遺傳依據(jù)。
本研究借助三代PacBio HiFi和Hi-C等技術(shù),構(gòu)建了高質(zhì)量染色體水平的疏花水柏枝基因組,最終組裝大小為1.34Gb,contig N50=11.69Mb。二代、三代回比比對(duì)率分別為94.14%和99.75%,CEGMA和BUSCO評(píng)估分別為93.67%和96.47%,表明組裝的基因組完整性比較高。結(jié)合轉(zhuǎn)錄組預(yù)測(cè)、同源預(yù)測(cè)和從頭預(yù)測(cè)的方式共得到23,719個(gè)蛋白質(zhì)編碼基因。
圖1-疏花水柏枝表型和基因組特征
比較基因組研究發(fā)現(xiàn)疏花水柏枝與苦蕎(F. tataricum)的親緣關(guān)系最為密切,大約在65-81百萬年前(Mya)發(fā)生分化;在19.74 ~ 24.60 Mya之間發(fā)生了一次全基因組復(fù)制(WGD), 4dTV分析證實(shí)了這一點(diǎn)。在0.15 Mya左右存在一個(gè)長末端重復(fù)(LTR)插入。這些基因組變化可能與疏花水柏枝在進(jìn)化過程中所經(jīng)歷的環(huán)境劇變(如青藏高原隆升)有關(guān)。基因家族分析顯示疏花水柏枝的特有基因家族與能量代謝和信號(hào)轉(zhuǎn)導(dǎo)密切相關(guān);85個(gè)基因在疏花水柏枝基因組中經(jīng)歷了正選擇,這些基因在與氨基酸合成和代謝相關(guān)的KEGG通路中顯著富集。
圖2-疏花水柏枝系統(tǒng)進(jìn)化研究
作者通過比較水淹和對(duì)照條件下疏花水柏枝形態(tài)、生理和轉(zhuǎn)錄組學(xué)的變化,分析了植物對(duì)水淹的適應(yīng)機(jī)制。總體而言,在完全淹沒的狀態(tài)下,疏花水柏枝采用“靜止”的策略。具體來說,在淹水條件下,光合作用減弱,生長停滯,糖酵解被激活,抗氧化酶系統(tǒng)增強(qiáng)。乙烯反應(yīng)途徑可能是這一過程的調(diào)控因子,MlERF-VII基因(Mla11G026380)可能是調(diào)控這一過程的關(guān)鍵基因。
圖3-疏花水柏枝水淹脅迫響應(yīng)信號(hào)通路
本研究成功構(gòu)建了一個(gè)染色體水平的疏花水柏枝基因組,并對(duì)其特征進(jìn)行了分析。進(jìn)一步結(jié)合形態(tài)學(xué)、生理學(xué)和比較轉(zhuǎn)錄組學(xué)分析評(píng)估了該物種適應(yīng)極端洪水環(huán)境(完全淹沒)的遺傳機(jī)制。本研究對(duì)疏花水柏枝種質(zhì)資源的保護(hù)和資源的開發(fā)利用具有重要意義。
]]>