Nanopore三代測序是一種單分子實時電信號測序技術(shù),又稱為Isoform Sequencing(Iso-Seq),無需打斷,可直接讀取從5’端到3’端polyA尾的高質(zhì)量單個RNA分子全長序列。2018年,北京百邁客與牛津納米孔公司(Oxford Nanopore Technologies,簡稱ONT)達(dá)成長期合作,基于ONT測序平臺進(jìn)行產(chǎn)品開發(fā)與應(yīng)用。目前,百邁客擁有MinION、GridION X5和PromethION三種型號全套納米孔測序儀。相比于二代RNA-Seq測序技術(shù),ONT三代測序無/低GC含量偏好性,多比對效率低,可準(zhǔn)確識別可變剪接(AS),可選擇性多聚腺苷酸化(APA),基因家族,融合基因,lncRNA及其靶基因,而且可同時對基因和轉(zhuǎn)錄本進(jìn)行定量分析。
基于Nanopore測序平臺的優(yōu)勢,ONT全長轉(zhuǎn)錄組越來越受到廣大研究者的青睞,大家也越來越關(guān)注全長轉(zhuǎn)錄組研究應(yīng)用方向,以及如何充分利用ONT測序數(shù)據(jù),發(fā)表高分高質(zhì)量文章。相較于農(nóng)學(xué)科研研究,ONT全長轉(zhuǎn)錄組在醫(yī)學(xué)研究方向日漸成熟,在各類疾病,如肺癌,白血病,精神病,腎病,乳腺癌等都有文章發(fā)表。今天小編跟大家分享一下ONT全長轉(zhuǎn)錄組應(yīng)用方向和農(nóng)學(xué)經(jīng)典案例!
ONT全長轉(zhuǎn)錄組經(jīng)典應(yīng)用方向:
1. 完善基因組注釋:由于ONT測序鑒定出新基因,新的isoforms,在完善基因組注釋方面獲得關(guān)注。
2. 基因結(jié)構(gòu)的研究:可變剪接、APA、融合基因、基因家族、lncRNA及其靶基因預(yù)測。
1) 可變剪接事件的發(fā)生,使一個基因產(chǎn)生多個不同的mRNA轉(zhuǎn)錄本,進(jìn)而能夠翻譯成多種不同的蛋白??勺兗羟惺钦{(diào)節(jié)基因表達(dá)和產(chǎn)生蛋白質(zhì)多樣性的重要原因,是轉(zhuǎn)錄后水平調(diào)節(jié)基因表達(dá)的重要機制之一。它在在動物的生長發(fā)育、細(xì)胞分化、細(xì)胞功能等方面具有重要作用。
2) APA是指一個基因上有多個多聚腺苷酸化位點,從而使得一個基因可以產(chǎn)生多條帶有不同長度3’UTR的mRNA,或產(chǎn)生不同編碼序列的轉(zhuǎn)錄本,APA增加了轉(zhuǎn)錄組的復(fù)雜性。APA影響胚胎發(fā)育、細(xì)胞分化、細(xì)胞增殖、神經(jīng)元活性、免疫應(yīng)答、腫瘤形成與轉(zhuǎn)移等生物學(xué)過程。
3) 融合基因指兩個個或多個基因的編碼區(qū)首尾相連,置于同一套調(diào)控序列 (包括啟動子、增強子、核糖體結(jié)合序列、終止子等) 控制之下構(gòu)成的嵌合基因,由染色體重排產(chǎn)生,包括染色體易位、缺失、插入、顛倒等。研究表明,許多疾病、癌癥與融合基因的發(fā)生相關(guān)。
4) 真核生物轉(zhuǎn)錄組中存在大量長非編碼RNA(long non-coding RNA,lncRNA),這些lncRNA可能在基因表達(dá)調(diào)控中起關(guān)鍵性作用。挖掘lncRNA的序列、結(jié)構(gòu)、表達(dá)及功能信息是研究生物學(xué)問題必不可少的部分。
3. 基因功能研究:通過傳統(tǒng)Race獲得整個轉(zhuǎn)錄本全長,實驗經(jīng)費、時間成本高,而通過三代測序可獲得全長,無需RACE實驗。
4. 轉(zhuǎn)錄本定量:ONT全長轉(zhuǎn)錄組可同時對基因和轉(zhuǎn)錄本進(jìn)行定量,不需要二代數(shù)據(jù)輔助。而一些已知關(guān)鍵基因探索新功能,基因發(fā)生變異變化的是不同的轉(zhuǎn)錄本,不是整個基因的變化。而在進(jìn)行差異基因研究時,基因表達(dá)沒有差異,轉(zhuǎn)錄本定量可能會出現(xiàn)差異。
經(jīng)典案例解讀
成功案例一
英文題目:Comparative Analyses of Full-Length Transcriptomes Reveal Gnetum luofuense Stem Developmental Dynamics
中文題目:全長轉(zhuǎn)錄組的比較分析揭示了羅浮買麻藤莖的發(fā)育動力學(xué)
發(fā)表期刊:Frontiers in genetics
影響因子:4.599
原文鏈接:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC8027257/
主要實驗方法和材料
材料:GLN01(莖尖,直徑=0.5-2mm)、GLN02(2-3 mm)、GLN03(3-4 mm)和GLN04(4-5 mm)。每個發(fā)育階段制備了三個重復(fù)樣品(兩個來自雌性個體,一個來自雄性個體)
測序平臺:MinION,共構(gòu)建12個轉(zhuǎn)錄組文庫。
主要研究結(jié)果與分析
1. AS和APA分析
在12個羅浮買麻藤莖樣本中檢測到總共24151個AS事件(圖2A)。其中,內(nèi)含子保留所占比例最大(7.793個事件;33.23%),而可變外顯子所占比例最?。?19個事件;1.32%)。內(nèi)含子保留數(shù)在GLN02期和GLN04期之間顯著增加(圖2B)??勺?’剪接位點在GLN03和GLN04之間顯著增加,而可變3’剪接位點和外顯子跳躍僅在GLN03中顯著增加(p值<0.05)。APA分析結(jié)果顯示,3’末端有5個多聚腺苷酸化位點的轉(zhuǎn)錄本所占比例最大(57194;42.56%),其次是只有一個位點(18948;14.02%)或兩個位點(16189;12.05%)的位點(圖2C)。APA事件的數(shù)量在整個買麻藤莖發(fā)育過程中也沒有顯著差異(圖2D)。在3’UTR上游50nt位置檢測到尿嘧啶(U)的富集,而在下游50 nt位置發(fā)現(xiàn)腺嘌呤(A)的富集,這表明所有poly(A)位點存在核苷酸偏倚(圖2E)。在所有轉(zhuǎn)錄本中,在poly(A)位點上游50 nt位置也檢測到三個保守基序(即AAAUGC、CCAUGC和CCAUCC)(圖2F)。
圖2 AS和APA事件的鑒定
2. CDS and lncRNAs分析
總共鑒定了38108個ORF,包括30323個(79.57%)完整的ORF,它們同時具有起始密碼子和終止密碼子。就完整的ORF而言,100-200 bp(12855個ORF)、0-100 bp(12150個)和200-300 bp(3751個)長度所占比例最大(圖3A)。共鑒定出728個lncRNAs,平均長度在298到4362 nt之間。這些lncRNAs進(jìn)一步分類為545個基因間區(qū)lncRNAs(74.86%)、28個反義lncRNAs(3.85%)、13個內(nèi)含子lncRNAs(1.79%)和142個正義lncRNAs(19.50%)(圖3C)。研究還發(fā)現(xiàn),這些lncRNAs調(diào)控的順式靶基因比那些反式靶基因多(圖3D)。發(fā)現(xiàn)在GLN01和GLN03之間(Student t檢驗,p=0.002),以及GLN01和GLN04之間(p=0.037),這些lncRNAs調(diào)控的順式靶基因顯著增加,而這些lncRNAs調(diào)控的反式靶基因在整個莖發(fā)育過程中未發(fā)現(xiàn)顯著變化。
圖3基于12個全長轉(zhuǎn)錄組的ORF和lncRNAs鑒定
3. TF and WGCNA Analyses
共鑒定出4251個TFs,屬于208個基因家族。其中最豐富的是AP2/ERF(176)、MYB相關(guān)(135)和bHLH(133)(圖4A),同時WGCNA分析也確定了與羅浮買麻藤莖發(fā)育高度相關(guān)的八個TFs模塊(圖4B、C)。綠松石色(編號1,315 TFs)、黑色(編號2,215 TFs)和黃色(編號7,75 TFs)最富集。綠松石色模塊中的TF主要在GLN01中表達(dá),而黑色和黃色模塊中的TF分別在GLN02和GLN04中密集表達(dá)(圖4B、C)。很明顯,綠松石色模塊中的TFs主要通過三種KEGG途徑富集,“淀粉和蔗糖代謝”(11 TFs,ko00500)、“淀粉和蔗糖代謝”(8 TFs,ko00500)和“戊糖和葡萄糖醛酸鹽相互轉(zhuǎn)化”(6 TFs,ko00040)(圖4D)。類似地,黑色模塊中的TFs主要富集于“植物-病原體相互作用”(6 TFs,ko04626)、“碳代謝”(4TFs)和“苯丙烷生物合成”(4 TFs,ko00940),而黃色模塊中的TFs主要富集于“氰基氨基酸代謝”(2 TFs,ko00460)和“糖酵解/糖異生”(2 TFs,ko00010)。此外,還發(fā)現(xiàn)綠松石色模塊中bHLH、GRF和MYB相關(guān)蛋白高度表達(dá);在黑色模塊中EGAP2/ERF、NAC和MYB高度表達(dá);在黃色模塊中MYB、bZIP和PLATZ高度表達(dá)(圖4E)。

圖4 TFs的鑒定和WGCNA分析
4. DET s and K-Means Clustering
結(jié)果顯示GLN01和GLN04之間有492個DET,其中283個上調(diào),209個下調(diào)(圖5A)。接著是GLN01和GLN02,GLN01和GLN03,分別有468個和136個。富集分析結(jié)果顯示,GLN01和GLN04之間的DET在三條KEGG途徑:“苯丙烷生物合成”(16個DET)、“淀粉和蔗糖代謝”(10個DET)和“氰基氨基酸代謝”(8個DET)中顯著富集(圖5C)。
然后,使用K-均值聚類算法將所有DET分為七類(圖5D)。結(jié)果表明,來自K7簇的轉(zhuǎn)錄物主要表達(dá)在頂端(GLN01),而其余簇,K3和K4,主要表達(dá)在GLN02和GLN04之間。這七個簇的轉(zhuǎn)錄本在多個GO術(shù)語中富集(圖5E),例如,K7簇轉(zhuǎn)錄物在“細(xì)胞壁生物發(fā)生”、“植物型細(xì)胞壁組織”和“細(xì)胞壁”術(shù)語中富集,來自K3簇的轉(zhuǎn)錄物在“調(diào)控莖尖分生組織發(fā)育”、“調(diào)控葉片發(fā)育”和“對內(nèi)源刺激的反應(yīng)”術(shù)語中富集,而來自K4簇的轉(zhuǎn)錄物在“氮化合物轉(zhuǎn)運”、“脈管發(fā)育”和“光系統(tǒng)I”富集。
圖5 DET-s和DET-s的K-均值聚類分析
5. 總結(jié)
在羅浮買麻藤莖的12個全長轉(zhuǎn)錄組中預(yù)測有24151個AS事件、134391個APA事件和728個lncRNAs。WGCNA和K-means聚類分析表明,關(guān)鍵轉(zhuǎn)錄因子與一系列KEGG途徑有關(guān),包括光合作用、氮運輸和葉片個體發(fā)育。這些發(fā)現(xiàn)為與羅浮買麻藤相關(guān)的纖維和造紙工業(yè)提供了有價值的信息,并闡明了納米孔測序技術(shù)在裸子植物全長轉(zhuǎn)錄組研究中的應(yīng)用。
成功案例二
英文題目:Nanopore long-read RNAseq reveals regulatory mechanisms of thermally variable reef environments promoting heat tolerance of scleractinian coral Pocillopora damicornis
中文題目:ONT全長轉(zhuǎn)錄組揭示熱變化的珊瑚礁環(huán)境中促進(jìn)鹿角珊瑚耐熱性的調(diào)節(jié)機制
發(fā)表期刊:Environmental research
影響因子:6.498
原文鏈接:https://pubmed.ncbi.nlm.nih.gov/33503412/
主要實驗方法與材料
材料:位于中國海南三亞灣鹿回頭邊緣礁石頭,高溫淺水區(qū)HP和氣溫深水區(qū)LP組中,每十個樣本中有兩個以等摩爾量混合以制備新樣本,以覆蓋更多樣本,即每組使用五個生物重復(fù)。
建庫測序:PromethION平臺,共構(gòu)建了10個轉(zhuǎn)錄組文庫(HP組的Q1-Q5和LP組的S1-S5)。
主要實驗結(jié)果與分析
1. APA和AS鑒定
APA和AS的鑒定增強了我們對轉(zhuǎn)錄異構(gòu)體多樣性生物學(xué)作用的理解。在本研究中,確定了9035例AS事件,并將其分為五類(圖2)。在檢測到的全部轉(zhuǎn)錄本中,有6.86%由某種可變剪切形式產(chǎn)生,其中內(nèi)含子保留是最常見的可變剪切事件。此外,在88092個基因位點上進(jìn)一步確定了207955個APA事件。
圖2 APA和AS鑒定
2. lncRNAs鑒定
有904個lncRNAs在Pfam、CPC、CNCI和CPAT都有鑒定到(圖3A)。對lncRNAs進(jìn)行分類和映射,發(fā)現(xiàn)基因間區(qū)的lncRNAs所占比例最多(688,76.1%)。
圖3 lncRNAs鑒定
3. lncRNAs和mRNAs在不同環(huán)境中的動態(tài)表達(dá)
共鑒定出1390個mRNAs(671個上調(diào),719個下調(diào))和50個lncRNAs(22個上調(diào),28個下調(diào))(圖4B和C)。在本研究中,預(yù)測DE-lncRNAs與其靶mRNA協(xié)同發(fā)揮其功能,從而說明珊瑚對環(huán)境變化的適應(yīng)。對lncRNA靶向mRNAs進(jìn)行KEGG富集分析,以探索鹿角珊瑚lncRNAs的功能。根據(jù)KEGG分析,DE-lncRNA靶向mRNA在五條途徑中顯著富集(q值<0.05),如ko00603鞘糖脂生物合成-球狀系列、ko00531氨基糖降解、ko00604鞘糖脂生物合成-神經(jīng)節(jié)苷脂系列、ko00511其他聚糖降解、ko04142溶酶體、,ko00520氨基糖和核苷酸糖代謝,以及ko03013 RNA轉(zhuǎn)運。
圖4 lncRNAs和mRNAs在不同環(huán)境中的動態(tài)表達(dá)
4. 總結(jié)
珊瑚礁熱環(huán)境的變化促進(jìn)了鹿角珊瑚的耐熱性。本研究首次對APA和AS進(jìn)行了全面分析,并驗證了鹿角珊瑚對熱變化礁環(huán)境的反應(yīng)中l(wèi)ncRNA-mRNA共表達(dá)網(wǎng)絡(luò)的有效性,這可能在其熱適應(yīng)反應(yīng)中起著關(guān)鍵作用。此外,作者猜想熱變化的珊瑚礁環(huán)境通過代謝調(diào)節(jié)促進(jìn)了鹿角珊瑚的耐熱性,并且較低的代謝率與耐熱性的增加呈正相關(guān)。本文報告的數(shù)據(jù)提供了關(guān)于lncRNAs在鹿角珊瑚耐熱性中作用的重要信息,為進(jìn)一步闡明lncRNAs在無脊椎動物環(huán)境應(yīng)激反應(yīng)中調(diào)控mRNA表達(dá)的機制提供了基礎(chǔ)。因此,這些發(fā)現(xiàn)表明,鹿角珊瑚在未來可能具有適應(yīng)氣候變化的潛力。