泛基因組(Pan-genome)即某一物種全部基因的總稱,這里這個全部基因是有別于個體基因組的基因的。一個個體的基因組是這個物種基因組的代表。因此,以一個基因組為模板的分析不能全面的反應(yīng)物種基因水平的全部遺傳信息,尤其是在研究同一物種中差異巨大的不同亞種或者變種,此類特有片段的差異往往要比共有片段中的差異更為重要。分析核心基因和非核心基因的基本情況,并從特有基因序列的角度來研究物種內(nèi)的差異。
泛基因組主要有3種構(gòu)建方法:Map to pan,Iterative assembly和De novo assembly。從頭組裝(De novo assembly):是構(gòu)建泛基因組或者參考基因組最經(jīng)典的方法,分別對多個個體分別進(jìn)行從頭組裝并且注釋,然后將所得的每個個體的組裝好的序列與參考序列基因組進(jìn)行互相比對,找出比對不上的區(qū)域或者基因,這些個體獨(dú)特的基因就是非核心基因。
Pan-genome研究 | 研究內(nèi)容 | |
基因組組裝 | Pan-genome構(gòu)建、多軟件組裝、組裝結(jié)果評估 | |
基因預(yù)測與注釋 | 編碼基因預(yù)測;重復(fù)序列注釋和轉(zhuǎn)座元件分類;非編碼RNA注釋;假基因注釋等 | |
Hi-C輔助基因組組裝 | 有效數(shù)據(jù)評估;Contig聚類、排序及定向分析;掛載結(jié)果評估 | |
生物學(xué)問題解析 |
常規(guī)分析 |
核心基因與非核心基因分析; |
非核心基因區(qū)結(jié)構(gòu)變異分析(SV,PAV,CNV); | ||
基因家族聚類分析; | ||
系統(tǒng)進(jìn)化分析; | ||
高級分析 | 群體功能基因定位研究:GWAS,QTLs定位等 | |
數(shù)據(jù)庫部署 |
樣品寄送
公司成立于2009年,深耕基因組測序領(lǐng)域十多年,長久以來致力于成為精準(zhǔn)的基因組組裝專家;
擁有主流的三代測序平臺(PacBio測序全平臺和Nanopore測序全平臺),具有豐厚的雙平臺組裝及上萬種物種基因組組裝經(jīng)驗(yàn)。在Pan-genome的構(gòu)建上,具有優(yōu)勢。
Hi-C染色質(zhì)構(gòu)象捕獲技術(shù)文庫有效數(shù)據(jù)比例高,掛載效率高達(dá)99%,多倍體物種研究經(jīng)驗(yàn)豐富,在泛基因組結(jié)構(gòu)變異研究中可與Hi-C做整合,進(jìn)一步精準(zhǔn)鑒定基因組結(jié)構(gòu)變異。
除Pan-genome的構(gòu)建外,公司致力于成為專業(yè)的功能基因定位專家,在泛基因組高級分析內(nèi)容群體功能基因定位中具有和大的優(yōu)勢。
期刊:Nature Genetics
影響因子:27.125
發(fā)表單位:華中農(nóng)業(yè)大學(xué)、北京百邁客生物科技有限公司等
發(fā)表年份:2018年12月
研究背景:
棉花是世界上最大的天然紡織纖維來源,它起源于大約1-2百萬年前的異源多樣化事件,隨后是數(shù)千年的不對稱亞基因組選擇。陸地棉(G. hirsutum)由于其高產(chǎn)而在全世界種植。G. barbadense以其卓越的纖維質(zhì)量而受贊譽(yù)。為了培育產(chǎn)生纖維更長,更細(xì)和更強(qiáng)韌的陸地棉(G. hirsutum)品種,一種方法是將海島棉(G. barbadense)的優(yōu)良纖維性狀引入陸地棉。基因組學(xué)啟動的育種策略需要對基因組組織進(jìn)行詳細(xì)而有力的理解。
研究結(jié)果:
1、陸地棉和海島棉基因組組裝:
利用三代測序(PacBio RSII)+光學(xué)圖譜(BioNano Genomics Irys)+Hi-C相結(jié)合的方法進(jìn)行異源四倍體陸地棉和海島棉基因組組裝。組裝獲得陸地棉Contig L50 = 1.89 Mb,海島棉Contig L50 = 2.15 Mb,Hi-C染色體掛載效率分別為 98.94%和97.68%(圖1)。
2、陸地棉和海島棉全基因組變異分析:
對異源四倍體陸地棉和海島棉進(jìn)行全基因組變異分析,包括SNPs和Indels變異分析,染色體結(jié)構(gòu)變異及PAVs分析(圖2)。預(yù)測的SNPs和InDels對陸地棉和海島棉的基因具有很大的功能影響,進(jìn)一步利鑒定了受到了正向選擇(Ka/Ks >1)的基因;利用Hi-C進(jìn)行染色體結(jié)構(gòu)變異分析,發(fā)現(xiàn)有170.2 Mb的基因組序列被鑒定為G. hirsutum和G. barbadense之間的倒位。
3、Gossypium hirsutum漸滲系構(gòu)建及QTLs定位:
研究中構(gòu)建了漸滲系群體,旨在引入有利的變異,控制從G.barbadense到G. hirsutum等重要農(nóng)藝性狀的形成,如纖維質(zhì)量。通過分子標(biāo)記對168份漸滲系材料進(jìn)行測序,并鑒定了涵蓋所有26條染色體的466個基因滲入片段(圖3)。進(jìn)一步研究結(jié)果表明,陸地棉中無絨毛突變體的遺傳變異與海島棉中的數(shù)量性狀基因座(QTL)共定位。該漸滲片段與天然纖維突變體的特征將有助于比較分析海島棉和陸地棉之間的絨毛纖維起始機(jī)制。
研究結(jié)論:
研究中通過陸地棉(Gossypium hirsutum)和海島棉(Gossypium barbadense)兩種栽培棉種質(zhì)基因組的重新組裝,鑒定了大量的變異,這些變異應(yīng)與其它種質(zhì)的基因組分析相結(jié)合,以充分挖掘兩種種質(zhì)基因組間的差異。進(jìn)一步通過構(gòu)建滲入系,在兩種代表性種質(zhì)間探索研究了具有潛在優(yōu)質(zhì)纖維質(zhì)量性狀的基因組序列信息,而這在棉花育種中,可用于理想性狀的培育;這些資源將極大的促進(jìn)棉花功能基因組學(xué)與進(jìn)化基因組學(xué)的研究,并將為棉花纖維質(zhì)量的改良提供信息。