2025年3月5日,貴州大學王孝敬、牛素貞和華北理工大學宋小明等在iMeta在線發(fā)表了題為“T2T genome, pan-genome analysis, and heat stress response genes in Rhododendron?species”的文章。該研究首次報道了T2T水平的百合杜鵑基因組,鑒定了幾個與熱脅迫相關的關鍵基因和miRNA,為杜鵑屬植物的比較基因組學和功能基因組學研究提供了豐富的資源。
文章題目:T2T?genome,?pan-genome?analysis?and?heat?stress response?genes?in?Rhododendron?species
發(fā)表期刊:iMeta
影響因子:23.8
合作單位:貴州大學,華北理工大學
百邁客生物為此項研究提供基因組測序及部分分析服務。
研究亮點:
① 該研究首次報道了具有13條染色體的高質量端粒到端粒(T2T)的百合杜鵑基因組;
② 基于15個杜鵑屬植物基因組,對杜鵑屬植物進行了泛基因組分析;
③ 結合基因組測序和全轉錄組測序,鑒定了幾個與熱脅迫相關的關鍵基因和miRNA,為杜鵑屬植物的比較基因組學和功能基因組學研究提供了豐富的資源。
研究背景
杜鵑花屬于杜鵑花科,是木本植物中最大的屬之一。全世界大約有1000種杜鵑花,中國是重要的分布中心。它們在喜馬拉雅-橫斷山脈經歷了進化輻射,橫斷山脈是世界生物多樣性的熱點。杜鵑花屬植物因其觀賞價值而在園藝中占有重要地位。全球氣候變化導致溫度升高,而熱脅迫會影響植物的生長發(fā)育。然而,杜鵑花植物通常適應較冷的氣候。利用多組學分析和分子生物學技術研究杜鵑花對高溫脅迫的響應機制,對選育耐熱品種、擴大杜鵑花栽培范圍具有重要意義。
材料及方法
T2T基因組組裝:Rhododendron liliiflorum
泛基因組分析:4個本次組裝的基因組+11個已報到的杜鵑屬基因組
全轉錄組:CK熱處理、熱處理3天(H3)和6天(H6)條件下進行了全轉錄組測序
兩對具有代表性的miRNAs和相關靶基因進行功能驗證。
研究結果
1.杜鵑屬植物基因組測序、組裝與評價
該研究通過PacBio HiFi、Oxford Nanopore Technology(ONT)、Illumina和Hi-C技術(圖1A,表S1-6)對四種杜鵑花植物(Rhododendron liliiflorum、Rhododendron decorum、Rhododendron platypodum和Rhododendron concinnum)進行從頭基因組測序。通過K-mer估算的R. liliiflorum、R. decorum、R. platypodum和R. concinnum的基因組大小分別為759.08 Mb、581.05 Mb、593.47 Mb和1356.22 Mb,并通過流式細胞術進一步驗證(表S1,圖1B)。
作者發(fā)現(xiàn),R. concinnum的基因組幾乎是其他三個物種的兩倍大。因此,作者們利用流式細胞術進一步分析了染色體核型,首次發(fā)現(xiàn)R. concinnum為四倍體,核型為2n=4x=52,與其他三個二倍體物種(2n=2x=26)有明顯差異(圖1C,表S1)。
4個物種的基因組大小分別為793.25 Mb、649.87 Mb、652.27 Mb和1321.11 Mb(表S1)。經Hi-C檢測,4個種的染色體錨定率均在97.90%以上(圖1D,表S5)。作者獲得了4個高質量的組裝基因組,支架N50大于48.68 Mb。核心真核基因作圖法(CEGMA)值從95.63%到99.56%,基準通用單拷貝同源序列(BUSCO)值從96.65%到97.34%,讀取作圖率超過99.40%(表S7)。
最重要的是,作者獲得了一個高質量的R. liliiflorumT2T基因組,該基因組由13條染色體組成,檢測到24個端粒和13個著絲粒(圖S1A,表S8-11)。其中11條染色體在端粒與端粒之間沒有間隙,另外2條染色體只有一個間隙。百合杜鵑花基因組的重疊群N50大于58.56MB,大于以往大多數杜鵑基因組的重疊群N50。采用BUSCO軟件對基因組完整性進行評估(96.65%),基因組一致性質量值(QV)為43.71(表S1)。基因組LTR組裝指數(LAI)值為21.15(圖S1B),表明已達到最高質量水平(LAI≥20)。
重復序列占4個基因組的49.10%以上,以長末端重復序列(LTRs)最多(圖1E,表S11)。在這四個基因組中,共預測到41406、41084、40556和83203個基因(表S12)。檢測到超過97.15%的BUSCO基因,說明預測的完整性較高(表S13)。NR、eggNOG、GO、KEGG、TrEMBL、KOG、Swissprot和Pfam數據庫對92.16%以上的基因進行了注釋(表S14)。共檢測到2355、4862、2852和9511個非編碼RNA(表S15)。
2.15個杜鵑屬植物泛基因組分析
杜鵑屬植物以其多樣的花朵展示而聞名,近年來,隨著第一個R. delavayi基因組的公布,一些基因組被解碼,引起了科學界的高度關注。報道了幾種杜鵑屬植物的基因組,如R. griersonianum、R. Henanense、R. Irroratum、R. kiyosumense、R. Ripense、R. Vialii、R. nivale和R. williamsianum。這些基因組為泛基因組研究奠定了基礎?;谶@四個高質量基因組以及11個先前發(fā)表的基因組,對杜鵑屬植物進行了泛基因組分析(圖1F,表S16)。選擇T2T水平的R. liliiflorum基因組作為參考。該泛基因組通過添加394.57?Mb和14424個基因,擴展了T2T水平的R. liliiflorum基因組。15個物種的基因家族數量為45731個,包括5734個核心基因家族、37027個可有可無的基因家族和2970個私有基因家族(圖1G、圖S2A、表S17)。利用打亂圖分析了15個物種間基因家族共享與唯一性的關系。最后,作者基于聚類分析構建了基因家族存在與否的分布圖(圖1H)。在2970個私有基因家族中,R.irroratum(1705)的物種特異性基因最多(表S17,圖S2B)。功能富集分析表明,“倍半萜和三萜生物合成”和“亞油酸代謝”途徑顯著富集(圖S3)。共鑒定出121185個核心基因,R. ovatum基因組的數量最多(9847)(圖S2B)。功能富集分析表明,與花的顏色和香味相關的基因途徑顯著富集,如檸檬烯和蒎烯降解(圖S4)。
3.15個杜鵑屬植物基因組的變異分析
基于以T2T基因組為參考的泛基因組分析,作者對杜鵑花的單核苷酸多態(tài)性(SNPs)、插入和缺失(InDels)以及結構變異(SVs)等變異進行了全面鑒定(圖1I-L,圖S5)。四倍體R. concinnum具有最多的SNP(1876446)和InDels(447281)(圖1I,表S18-19)。功能富集分析表明,含有SNPs和InDels的基因在“碳代謝”和“氨基酸生物合成”途徑中顯著富集。R. concinnum的SV數量最多,達到7694(表S20)。同時,作者進一步將SVs細分為重復(DUP)、易位(TRANS)和反轉(INV),發(fā)現(xiàn)在大多數杜鵑屬植物中,前者的數量超過后者(圖S6-7)。SVs基因與SNPs或InDels基因相比表現(xiàn)出明顯的模式,主要集中在RNA聚合酶和mRNA監(jiān)控途徑上。
4.15個杜鵑花基因組的LTR分析
該研究在15個杜鵑屬物種的全基因組中鑒定了70759個LTR,其中R. griersonianum基因組的LTR數量最多(7323)(表S21)。作者發(fā)現(xiàn),在過去的一百萬年中,大多數杜鵑花物種只經歷了一次插入事件的爆發(fā),而R. delavayi、R. molle和R. williamsianum經歷了兩次插入事件的爆發(fā)。兩個事件分別發(fā)生在1.53mya和2.94mya。作者對15個物種的LTR進行聚類,得到每個聚類中的共享LTR。結果表明,共有2622個LTR聚類,其中R. platypodum最多(531個)。R. liliiflorum中特異性LTRs數量最多(109個),而R. williamsianum中未發(fā)現(xiàn)物種特異性LTRs。聚類圖顯示,R.williamsianum與其他物種共享LTR的比例最高(圖1M)。此外,LTR在染色體中部的分布密度大于兩端(圖1N)。
5.15個杜鵑屬植物基因組的共線性分析
通過共線性分析,研究發(fā)現(xiàn)15個杜鵑基因組普遍表現(xiàn)出良好的共線性(圖1O)。共線性區(qū)組數從336個(R. henanense?vs?R. delavayi)到692個(R. irroratum?vs?R. prattii)。此外,還發(fā)現(xiàn)了一些基因組轉座現(xiàn)象,如R. ovatum7號染色體的末端區(qū)域與R. simsii和R. henanense。

圖 1. 4種杜鵑屬及11種已發(fā)表杜鵑屬植物的基因組分析 (A)四種杜鵑花的開花照片;(B)通過k-mer進行基因組調查。(C)流式細胞術檢測染色體核型;(D)基因組組裝的Hi-C接觸圖;(E)轉座子、SSR、基因密度和GC含量在染色體上的分布;(F)核心(紅色)和非核心(藍色)基因家族數量趨勢圖;(G)核心集群、可有可無集群和私有集群的家族數量;(H)核心、可有可無和私有集群的存在和缺失分析;(I)百合杜鵑花基因組中基因密度、SNP和InDel變異的分布情況;(J-L)以T2T基因組為參照,研究了端粒紅豆杉、鴨嘴獸和短柄紅豆杉基因組的同源性和重排;(M)兩個物種之間共享LTR的比例(Rconc:?R. concinnum; Rdeco:?R. decorum; Rdela:?R. delavayi; Rgrie:?R. griersonianum; Rhena:?R. henanense; Rirro:?R. irroratum; Rlili:?R. liliiflorum; Rmoll:?R. molle; Rovat:?R. ovatum; Rplat:?R. platypodum; Rprat:?R. prattii; Rripe:?R. ripense; Rsims:?R. simsii; Rvial:?R. vialii; Rwill:?R. williamsianum);(N)LTR在染色體上的分布。x軸代表染色體位置的百分比,y軸代表LTR的插入時間;(O)15種杜鵑屬植物的基因組共線性。右邊的數字表示共線塊編號。
6.熱反應基因的全轉錄組測序與檢測
為了探索杜鵑花的耐熱基因和調控機制,該研究在CK熱處理、3天熱處理(H3)和6天熱處理(H6)條件下進行了全轉錄組測序(圖2A,表S22)。共鑒定出50648個mRNAs、17476個lncRNAs、448個miRNAs和6299個circRNAs(圖2B)。此外,在CK、H3和H6處理中,632個mRNAs、21個lncRNAs和6個miRNAs的表達和共享存在差異(圖2C)。
7.候選基因的功能驗證
該研究選擇了兩對具有代表性的miRNAs和相關靶基因進行功能驗證。熱處理后3h和6h,靶基因表達顯著上調,小RNA表達顯著下調。作者進一步研究了miR177對RdbHLH153(Rhdel02G0118700)表達和miR49對RdMYB1R1(Rhdel08G0208700)表達的影響。將螢火蟲熒光素酶分別融合到RdbHLH153和RdMYB1R1的C端,并將miR49和miR177分別插入SK載體(圖2D)。結果顯示,RdbHLH153中的miR177和RdMYB1R1中的miR49的靶位點略有改變(圖2E)。用RdbHLH153/RdMYB1R1與空SK載體(混合并滲透)或RdbHLH153與miR177(RdMYB1R1和miR49)的混合物對煙草單葉滲透區(qū)進行滲透。均顯示熒光素酶信號的誘導,而R. delavayi中過表達的miR177和miR49可消除RdbHLH153/RdMYB1R1產生的信號(圖2E-G)。
為了進一步研究RdbHLH153和RdMYB1R1在熱脅迫中的作用,采用花浸法獲得了過表達RdbHLH153和RdMYB1R1的轉基因擬南芥株系(表S23)。36 h熱處理后,轉基因植株的生長明顯優(yōu)于WT(圖2H)。經過熱處理后,幼苗恢復正常狀態(tài)5天,發(fā)現(xiàn)轉基因植株轉活,WT葉片全部變黃。說明RdbHLH153和RdMYB1R1在提高耐熱性中起重要作用。DAB和NBT染色顯示,與野生型植株相比,RdbHLH153/RdMYB1R1 OE株系中H2O2和O?2的含量顯著降低(圖2I)。

圖2. miRNA和靶基因的全轉錄組分析及功能驗證 (A)R. delavayi的對照(CK)和熱處理(H3和H6);(B)mRNA、lncRNA、miRNA和circRNA的鑒定和差異表達分析;(C)三種比較中特異性和常見的差異表達RNA;(D)效應器和報告器結構圖;(E)miR49和miR177靶點突變示意圖;(F)熒光素酶測定統(tǒng)計。誤差條表示三個重復的SEs(*,p?< 0.05)。(G)熒光素酶成像分析;(H)RdbHLH153和RdMYB1R1的過表達增強了耐熱性。NS表示無熱應激,HS-A表示36 h熱應激,HS-R表示36 h熱處理后在常溫下恢復5天;(I)二氨基聯(lián)苯胺(DAB)和硝基藍四氮唑(NBT)染色法檢測轉基因株系和WT在無熱脅迫(NS)和熱脅迫(HS)下的H2O2和O?2。
內容來源于iMeta