英文名:?Integration of full-length transcriptomics and?targeted metabolomics to identify?benzylisoquinoline alkaloid biosynthetic genes in?Corydalis yanhusuo
雜志:Horticulture Research
影響因子:5.404
延胡索( Corydalis yanhusuo W.T. Wang) ,別名元胡,罌粟科紫堇屬多年生草本植物,常以其干燥塊莖入藥,是世界上具有低成癮性和耐受性的鎮(zhèn)痛中藥,鎮(zhèn)痛效價約為嗎啡的60%。四氫巴馬汀和左旋紫堇達明已被確認為延胡索中具有鎮(zhèn)痛活性成分,可作為阿片類鎮(zhèn)痛藥的替代品,但含量低下,產(chǎn)量較小的缺點制約著該類藥物的應(yīng)用。
對合成原小檗堿型芐基異喹啉生物堿的相關(guān)基因進行了挖掘,為后期利用合成生物學與植物代謝工程生產(chǎn)延胡索中具有鎮(zhèn)痛效果的痕量化合物奠定了基礎(chǔ)。
延胡索,成熟期的葉和塊莖,道地產(chǎn)區(qū)浙江磐安
代謝:UPLC-Q-TOFMS定性定量
轉(zhuǎn)錄組:二代+三代全長轉(zhuǎn)錄組測序
1、轉(zhuǎn)錄組和代謝組測序分析
該研究以來自道地產(chǎn)區(qū)浙江磐安的延胡索成熟期的葉和塊莖為研究對象,采用UPLC-Q-TOFMS定性定量分析了延胡索中具有鎮(zhèn)痛活性的成分,并通過二代校準的三代全長轉(zhuǎn)錄組測序的方法對合成原小檗堿型芐基異喹啉生物堿的相關(guān)基因進行了挖掘。
延胡索提取物的塊莖和葉組QTOF-MS數(shù)據(jù)的代謝組學多元分析
延胡索塊莖和葉片之間基因的差異表達
2.、轉(zhuǎn)錄組-代謝組聯(lián)合分析
對處于不同器官的組織樣品進行了轉(zhuǎn)錄組-代謝組聯(lián)合分析,最終鑒定到了101個參與芐基異喹啉生物堿(benzylisoquinoline alkaloid,BIA)生物合成途徑的unigenes和38種在延胡索葉與塊莖中含量具有顯著差異的代謝物,并對其中19種典型的代謝物進行了器官差異性豐度測定。結(jié)果顯示,目前已知的合成途徑在延胡索中報導(dǎo)過的BIAs合成途徑中均成功對應(yīng)到至少一種關(guān)鍵合成酶的unigene,說明BIA的空間分布差異主要受到轉(zhuǎn)錄水平上的調(diào)控。
芐基異喹啉生物合成途徑
3、 OMT蛋白家族系統(tǒng)發(fā)育樹分析
進一步研究發(fā)現(xiàn),其中參與合成具有廣泛臨床鎮(zhèn)痛潛力的關(guān)鍵代謝物四氫巴馬汀的酶可能與唯一已知的黃連中負責催化這一步反應(yīng)的ColumbamineO-methyltransferase(CoOMT)存在較大的蛋白質(zhì)序列差異。通過系統(tǒng)發(fā)生樹分析,作者們推斷出至少存在10種unigenes的翻譯產(chǎn)物可能催化四氫巴馬汀的合成。 特異性的氧甲基化是四氫巴馬汀與紫堇達明合成的關(guān)鍵,延胡索中是否存在特殊的一類OMT或者具有不同底物特異性的OMT則是接下來將要重點解析的重點。
OMT蛋白家族系統(tǒng)發(fā)育樹
本研究明確了鎮(zhèn)痛成分的生物合成機制,同時為進一步生化水平上的活性驗證提供了方向,且為后期延胡索功能基因組的解析奠定基礎(chǔ)。
?
]]>發(fā)表期刊:Plant and Cell Physiology
發(fā)表時間:2020年10月
影響因子:4.799
干旱或缺水引起的脫水是世界上許多地區(qū)植物面臨的一種嚴重的非生物脅迫,嚴重制約著植物的生產(chǎn)力和生存。許多生物化學、生理和遺傳性狀已在不同的植物組織中進化出來,特別是根和葉,以應(yīng)對干旱脅迫。根是感知水分缺乏最敏感的器官,并相應(yīng)的調(diào)節(jié)水分和養(yǎng)分的吸收。在有限的水分條件下,它們可以通過表型和結(jié)構(gòu)上的改變來增加枝條和葉片對水分的吸收,以維持正常的水分利用。葉片是光合作用和蒸騰作用的主要器官,調(diào)節(jié)水分的吸收和流失。葉片對干旱的反應(yīng)是萎蔫、氣孔關(guān)閉、角質(zhì)層蠟沉積和減少光合作用,以減少水分的過度流失。因此,根系和葉片是調(diào)節(jié)水分在土壤和水分之間流動的最重要器官,但其對干旱脅迫響應(yīng)的分子機制尚不清楚。
玫瑰是園藝作物之一,無論是盆栽植物和切花在招待、娛樂和保健行業(yè)都有相當大的經(jīng)濟價值。由于玫瑰生長在亞熱帶氣候,對干旱和水分虧缺非常敏感,嚴重限制了其生長和開花。此前對玫瑰花瓣的轉(zhuǎn)錄組分析已經(jīng)確定了對疾病響應(yīng)、鹽度和熱脅迫以及與花色相關(guān)的基因。然而,玫瑰植株對干旱脅迫的分子響應(yīng)仍有待進一步研究。
高通量RNA測序(RNA-seq)已經(jīng)在楊樹和玉米中鑒定了許多干旱響應(yīng)基因。然而,傳統(tǒng)的RNA-seq產(chǎn)生的短讀序列并不包含完整的轉(zhuǎn)錄本,因此在預(yù)測新基因方面準確性較低。PacBio和Oxford Nanopore Technology (ONT)是一種新穎的RNA-seq方法,可以通過高通量產(chǎn)生長讀來讀取全長轉(zhuǎn)錄本,從而重構(gòu)編碼基因組。此外,ONT可以直接對RNA進行測序,并識別堿基修飾、可變剪接、聚腺苷酸化、和融合基因。因此,ONT RNA-seq在探索糧食作物和園藝作物抗旱性的分子機制方面很有前景。
在這項研究中,通過對正常、輕度和重度干旱條件下生長的玫瑰幼苗的光合速率和植物激素水平進行監(jiān)測,并采用ONT法對其全長轉(zhuǎn)錄本進行測序。通過對轉(zhuǎn)錄組數(shù)據(jù)的分析,既豐富了已注釋的玫瑰基因組,又為激素在干旱脅迫中的潛在作用提供了新的認識,同時也識別出了在應(yīng)對干旱脅迫時激活的新的調(diào)控網(wǎng)絡(luò)。這項研究提供的數(shù)據(jù)可以為開發(fā)新的轉(zhuǎn)基因耐旱玫瑰品種鋪平道路。
樣品做了三組處理:干旱處理0天(ND stress)、5天(MD stress)和10天(SD stress),并對光合作用進行了檢測,同時檢測了脫落酸(ABA)和生長素(auxin)的含量。
1.干旱脅迫對玫瑰幼苗生長發(fā)育和形態(tài)的影響
以2月齡玫瑰幼苗為材料,在不干旱(ND)、輕度干旱(MD)和SD脅迫條件下,對其相對含水量(RWC)和光合特性進行了分析。與ND對照相比,MD和SD植株的RWC分別下降到41%和15%(圖1A)。此外,定期澆水的植株看起來健康,葉子呈綠色/深綠色,而暴露在MD脅迫下的幼苗變黃,一些葉子彎曲并枯萎(圖1A)。另一方面,SD條件導(dǎo)致葉片大面積枯萎和卷曲(圖1A)。與此相一致的是,SD脅迫下幼苗的鮮重和干重均顯著低于ND和MD組(圖1B),說明過度脫水會降低養(yǎng)分吸收和植物生長。
圖1 干旱脅迫下玫瑰幼苗的形態(tài)變化
2.全長RNA-Seq及功能注釋
為了闡明干旱響應(yīng)的分子機制,對不同處理植株的葉(L)和根(R)進行了轉(zhuǎn)錄組測序。6個樣本(每個樣本3個生物重復(fù))共18個cDNA文庫,包括ND-L、MD-L、SD-L、ND-R、MD-R和SD-R。從最初的116,192,367 raw reads中,提取了115,374,531 (99.29%) clean reads,組成玫瑰全長非嵌合轉(zhuǎn)錄組。通過與Rosa chinensis 基因組比對,在轉(zhuǎn)錄組中鑒定出了48,549個基因,占基因組長度的21.46%。此外,共鑒定出59,404個開放閱讀框(ORF),如圖2A所示,只有19個編碼序列(CDSs)編碼>800個氨基酸的多肽,而58%的CDSs編碼長度在100 – 400個氨基酸的小肽(圖2A)。最后,89,044個非冗余轉(zhuǎn)錄本中的58,753個可以被注釋到不同的數(shù)據(jù)庫中(圖2B)。
圖2 干旱脅迫下玫瑰葉片和根中的DEGs
3.DEGs的比較分析
為了進一步闡明干旱誘導(dǎo)的玫瑰葉片和根的轉(zhuǎn)錄組變異,相對于ND,篩選出了MD和SD樣品的DEGs。從18個cDNA文庫中檢測到48,549個基因的表達量,根據(jù)錯誤發(fā)現(xiàn)率(FDR) (≤0.01)和log2值(≥2或≤0.05)鑒定出7,101個DEGs,其中669個(~9.4%)為新基因。此外,這些DEGs大部分在同一組的葉片和根中表現(xiàn)出不同的表達模式。MD和SD組葉片分別鑒定出580和3,326個DEGs,而與其對應(yīng)的根部樣品分別鑒定出3,445和1,751個DEGs,這表明干旱響應(yīng)的轉(zhuǎn)錄機制在根中占主導(dǎo)地位(圖 2C)。此外,在MD葉片和根中分別有237個和1438個基因表達上調(diào),343個和2007個基因表達下調(diào)。意料之中的是,SD條件下導(dǎo)致了總體上更大的轉(zhuǎn)錄組變化,在葉片中有1284個上調(diào)基因和2042個下調(diào)基因,在根中有365個上調(diào)基因和1386個下調(diào)基因(圖2D)。與SD-L、MD-R和SD-R相比,在MD-L中分別鑒定出331、258和547個特異基因,與SD-L相比,MD-R中有2963個特異基因。此外,有855個基因在MD-R和SD-R中均存在,而所有組中共有的基因只有13個(圖2C)。編碼脂質(zhì)轉(zhuǎn)運蛋白、早期光誘導(dǎo)蛋白、線粒體磷酸載體蛋白、鋅指蛋白和谷胱甘肽s轉(zhuǎn)移酶的DEGs主要集中在SD組,而細胞分裂控制蛋白在MD條件下誘導(dǎo)發(fā)生。
4.GO和KEGG富集分析DEGs
通過GO富集分析,將玫瑰葉片和根系干旱誘導(dǎo)基因分為生物過程(BP)、細胞成分(CC)和分子功能(MF)注釋。在MD-L中特異的干旱應(yīng)答基因富集在生物過程(天冬酰胺生物合成過程、鈣離子跨膜運輸)、分子功能(天冬酰胺合成酶(谷氨酰胺水解)活性、β-amyrin合成酶活性)以及細胞成分( COPII囊泡外殼)中。這些GO基因也在SD-L、MD-R和SD-R組中富集,表明這些基因可能參與信號轉(zhuǎn)導(dǎo)通路或其他響應(yīng)干旱脅迫的調(diào)控網(wǎng)絡(luò)。隨后的KEGG富集分析顯示,在MD脅迫下的玫瑰幼苗葉片在碳代謝(ko01200)、核糖體(ko03010)和aa的生物合成(ko01230)等方面的DEGs與其他樣品有顯著差異。受SD脅迫影響的基因主要涉及淀粉和蔗糖代謝(ko00500)、植物激素和信號轉(zhuǎn)導(dǎo)(ko04075)、核糖體(ko03010)、光合作用(ko00195)、碳代謝(ko01200)等。玫瑰幼苗根系中MD的響應(yīng)基因影響內(nèi)質(zhì)網(wǎng)中的碳代謝和蛋白質(zhì)加工。受MD和SD影響顯著的基因在苯丙素合成、植物激素和信號轉(zhuǎn)導(dǎo)、內(nèi)質(zhì)網(wǎng)蛋白加工等方面具有重要作用。綜上所述,調(diào)控碳代謝、植物激素合成和信號轉(zhuǎn)導(dǎo)的基因受到干旱脅迫的影響,可能在葉片和根的適應(yīng)反應(yīng)中發(fā)揮關(guān)鍵作用。
5.干旱脅迫降低了玫瑰的光合性能
圖3 干旱脅迫下玫瑰葉片光合作用的變化
鑒于玫瑰葉片在干旱脅迫下顯著枯萎(圖1A),因此對ND、MD和SD生長條件下葉片的光合參數(shù)進行了研究。雖然所有組的總?cè)~綠素含量沒有顯著差異(圖3 D),但干旱脅迫顯著降低了Pn、Gs和Tr指數(shù),在SD脅迫下降低的幅度比 MD更嚴重(圖3 B、C、F)。葉片中的Ci水平對MD和SD脅迫有不同的相應(yīng)。MD處理下的平均Ci降低了111 μmol/mol,長期干旱后Ci值增加了62.33μmol/mol,恢復(fù)正常。由此可見,干旱脅迫不利于玫瑰植株的光合性能,限制了葉片的生長。MD條件下的水分利用效率(WUE)高于ND和SD(圖3E),說明輕度水分虧缺增加了葉片有效利用水分的能力。為了進一步闡明其分子機制,對與光合作用途徑相對應(yīng)的轉(zhuǎn)錄組數(shù)據(jù)進行了分析。干旱脅迫下與光合作用相關(guān)的DEGs包含編碼PS II、PS I、葉綠體三磷酸腺苷(ATP)合酶亞基(ATP合酶)和葉綠素a/b結(jié)合蛋白。如圖3G所示,幾個PSII(gene 14042,gene 26289等)、PS I (gene 29343,gene 10875等)和ATP合酶(gene 28095, gene 31836等)基因在SD脅迫下表達下調(diào)至少0.5倍(圖3 G)。綜上所述,干旱脅迫誘導(dǎo)了玫瑰葉片的光合動態(tài)在轉(zhuǎn)錄水平上的變化。
6.干旱脅迫使脫落酸和生長素濃度增加
圖4 干旱響應(yīng)DEGs調(diào)控ABA和生長素的生物合成及信號通路
KEGG分析顯示,干旱脅迫下植物激素和信號轉(zhuǎn)導(dǎo)通路(ko04075)顯著富集。ABA和生長素是干旱脅迫下調(diào)節(jié)植物生長發(fā)育的主要激素,因此對干旱脅迫下玫瑰葉片和根中的這兩種激素的水平進行了檢測。ABA含量在干旱條件下急劇增加,并在長期(SD)脅迫下達到峰值(圖4A)。與對照相比,MD和SD環(huán)境下葉片中吲哚-3-甲醛(ICA)的含量分別上升3.44和7.96 ng/g,根中分別上升1.15和4.02 ng/g(圖4 E)。長期干旱脅迫下葉片中吲哚乙酸(IAA)含量顯著下降,根系中IAA含量在MD中增加,而在SD中下降(圖4 G)。相比之下,干旱脅迫下的玫瑰幼苗葉片和根中ME-IAA含量均顯著增加,且與SD相比,MD脅迫下葉片中ME-IAA含量更高(圖4 F)。最后,在干旱脅迫下,葉片中的IP濃度顯著降低,而根系中的IP濃度顯著升高(圖4 G)。在任何條件下都不能檢測到IBA水平。綜上所述,干旱脅迫觸發(fā)了玫瑰葉片和根部的激素變化,以維持生理過程。
7.DEGs參與ABA和生長素的生物合成及信號通路
與上述結(jié)果一致的是,干旱響應(yīng)的DEGs在類胡蘿卜素生物合成(次生代謝產(chǎn)物)、ABA生物合成和ABA信號通路中顯著富集。轉(zhuǎn)錄組數(shù)據(jù)中監(jiān)測到的ABA和生長素合成以及信號轉(zhuǎn)導(dǎo)相關(guān)基因的表達模式(圖4B, D),4個NCEDs,ABA合成的步驟,在MD-L和MD-R中誘導(dǎo)上調(diào)。轉(zhuǎn)錄本(gene 4639)編碼PYR/PYL,是ABA信號通路的關(guān)鍵因子,在所有組中表達上調(diào)。9個ABA誘導(dǎo)的PP2Cs,包括4個抑制ABA信號、促進GA信號的HAI同源物和5個激活A(yù)BA和Snf1相關(guān)激酶OST1的HAB同源物在MD和SD脅迫下均顯著上調(diào)。另外,SnRK2基因有2個在MD-L中上調(diào)(gene 10030, 2.45倍,gene 49803, 2.17倍),有3個在MD-R中上調(diào)(gene 10030, 4.81倍,gene 49802, 2.48倍,gene 49803, 2.91倍),有2個SnRK2基因在MD-L中下調(diào)(gene 49801, 0.17倍,gene 49802, 0.49倍)。最后,有3個ABF轉(zhuǎn)錄因子(gene 37633, gene 42692, gene 47967)在SD-L和SD-R 中上調(diào),進而激活A(yù)BA響應(yīng)基因。
絲蘭黃素單加氧酶是生長素合成的核心酶,在MD-L、SD-L、MD-R和SD-R樣品中均有高度誘導(dǎo)。TAA1控制陰暗條件下生長素的產(chǎn)生,并且在任何轉(zhuǎn)錄組中表達都沒有差異。在生長素響應(yīng)基因中,有6個SAUR基因在MD-L和SD-L下顯著上調(diào),2個基因下調(diào)(圖4D)。一個生長素受體F-box 蛋白TIR1(gene 49288)在SD-L中誘導(dǎo)上調(diào)3.22倍,2個AUX基因(gene 18102和gene 55695)在MD-L中誘導(dǎo)上調(diào)2倍。2個與生長素信號傳遞相關(guān)的IAA-?;?酰胺合成酶(gene 37308, gene 41087)也在干旱脅迫下被誘導(dǎo)。18個調(diào)控生長素反應(yīng)的基因ARF差異表達:6個在SD-L和MD-R中上調(diào),7個在MD-L和SD-L中下調(diào)。這些發(fā)現(xiàn)與干旱引起的生長素含量變化在前一節(jié)中的描述一致。
8.TFs 和IncRNA的鑒定
圖5 TFs和IncRNA的鑒定
干旱脅迫顯著改變了玫瑰葉片和根中與DEGs相關(guān)的279個轉(zhuǎn)錄因子的表達。MD和SD條件下,MYB、bHLH、b-ZIP、NF-Y、WRKY和AP2家族的TFs顯著富集,其中MYB、AP2和WRKY占主導(dǎo),差異表達的TFs分別為124、46和27個(圖5A)。bHLH和WRKY家族對干旱脅迫的響應(yīng)非常相似。在MD-L處理中,有少量的DEGs、上調(diào)基因,但有大量的下調(diào)基因。相比之下,SD-L處理在這些基因家族中導(dǎo)致了更多的上調(diào)基因,并且適應(yīng)干旱后的葉片和根的干旱響應(yīng)的倍數(shù)變化通常低于SD處理。如圖5C所示,在干旱脅迫下,葉片和根中分別有133和177個TF基因差異表達(圖5 C),其中31個基因是兩個器官共有的且表達模式相似。例如,gene 6966和49627在MD和SD條件下,在葉片和根中都是表達上調(diào)。一些蛋白激酶家族,包括RLK/Pelle_DLSV(142個成員,玫瑰轉(zhuǎn)錄組中較大的家族)和RLK/Pelle_ RLCK -VIIa -2(101個成員)(圖5 B),在玫瑰轉(zhuǎn)錄組中負責蛋白激酶的大小。
lncRNAs是非編碼轉(zhuǎn)錄本,可調(diào)節(jié)順式和反式基因的轉(zhuǎn)錄,從而控制組織發(fā)育的各個方面和對外部刺激的反應(yīng)(Kim和Sung 2012)。我們利用Pfam、編碼潛力計算器(CPC)、編碼潛力評估工具(CPAT)和編碼非編碼索引(CNCI)數(shù)據(jù)庫篩選了轉(zhuǎn)錄組數(shù)據(jù),分別鑒定出184、5,803、3,247和3,100個注釋轉(zhuǎn)錄本(圖5 F),其中2,410個新的lncRNAs注釋到了所有數(shù)據(jù)庫(圖5 E)。此外,這些常見lncRNAs中,65.64%(1582)為lincRNAs,4.61%(111)為反義lncRNAs,1.74%(42)為內(nèi)含子lncRNAs,28%(675)為正義lncRNAs(圖5 E)。我們還預(yù)測了2,403個lncRNAs的20,240個靶基因,其中537個和19,703個靶基因分別受反式和順式lncRNA的調(diào)控。因此,這些lncRNAs可能在應(yīng)對干旱脅迫時通過調(diào)控關(guān)鍵基因發(fā)揮重要作用。
9.干旱脅迫下玫瑰葉和根中DEGs聚類
接下來,根據(jù)RNA-seq數(shù)據(jù)鑒定了7101個DEGs,占本研究鑒定的所有基因的14.63% (7,101/48,549)。這些DEGs的熱圖表現(xiàn)出兩個保守組,如在干旱脅迫下誘導(dǎo)和抑制根和葉的表達模式(圖6 A)。然后使用K-means算法進行富集分析,得到16個聚類(K1-K16)(圖6 B)。在SD條件下,K12、K13和K16基因主要在葉片和根中表達,表明它們可能參與干旱脅迫。而在MD和SD處理下,K4、K5、K7、K9和K11基因在根和葉中均受到抑制。
我們還通過加權(quán)相關(guān)網(wǎng)絡(luò)分析來確定與干旱脅迫響應(yīng)相關(guān)的基因簇或模塊。所有基因聚類為33個模塊(圖6 C、E),其中tomato modules與SD-R、fire-brick與SD-L、light steel blue與MD-L、medium purple與ND-L和ND-R顯著相關(guān)(圖6 D)。各模塊KEGG富集分析顯示,干旱脅迫下大部分樣品富集苯丙素生物合成(ko00940)和核糖體(ko03010),SD-R樣品富集最顯著的通路是內(nèi)質(zhì)網(wǎng)蛋白加工(ko04141)(圖6 F)。綜上所述,上述途徑調(diào)節(jié)了玫瑰葉片和根系對干旱脅迫的響應(yīng)。
圖6 干旱脅迫下DEGs的整體表達模式
10.可變剪接異構(gòu)體及可變剪接的變化
RNA-Seq檢測到的轉(zhuǎn)錄本與R.chinensis ‘Old Blush’基因組進行比對,鑒定剪接異構(gòu)體。如圖7 A所示,我們從非冗余轉(zhuǎn)錄本中檢測到42,544個可變剪接(As),包括12,096個內(nèi)含子保留(IRs)、12,914個選擇性3’剪接位點(alt 3’)、7,433個選擇性5’剪接位點(alt 5’)、9,406個外顯子跳過(ES)和695個互斥外顯子(ME)(圖7 A)。IR在玫瑰葉片中最為常見,在ND-L、MD-L、SD-L和ND-R樣品中的比例分別占34.77%、30.83%、30.1%和29.56%。而在SD脅迫下,ES是主要的AS模式(占所有AS事件的32.16%)。在MD-R中最常見的AS事件是alt 3’ (32.38%), ME(1.75%)是最罕見的(圖7 B)。為了進一步驗證新發(fā)現(xiàn)的轉(zhuǎn)錄組剪接異構(gòu)體,我們隨機選擇了三個至少注釋到兩個異構(gòu)體上的基因(ONT.25325、gene 3669和gene 4728)進行RT- PCR驗證。在這些基因的第一個外顯子和最后一個外顯子或適當區(qū)域設(shè)計引物。如圖7 C所示,片段的條帶大小與轉(zhuǎn)錄組數(shù)據(jù)中發(fā)現(xiàn)的剪接亞型的條帶大小一致。對推測的剪接異構(gòu)體進行克隆、測序和比對,以驗證剪接連接。例如,ONT. 25325編碼了一個putative protein,呈現(xiàn)出4個剪接亞型(圖7C),并隨后得到證實。此外,gene 3669和gene 4728顯示出相同的剪接變異。此外,一些剪接異構(gòu)體,如gene 3669,在對照和干旱脅迫下表現(xiàn)出差異。新的可變剪接體的鑒定進一步注釋了R.chinensis ‘Old Blush’基因組。
圖7 干旱脅迫下AS表達譜
作者分析了干旱引起的玫瑰幼苗葉片和根部光合作用和激素水平的變化,首次在MD和SD條件下建立了全長玫瑰轉(zhuǎn)錄組,并鑒定了組織特異性的干旱響應(yīng)基因、TFs 、lncRNA和AS。鑒定出特定組織在不同干旱條件下參與光合作用,ABA和生長素生物合成和信號傳導(dǎo)的基因模塊,本研究中提供的信息補充了R. chinensis的現(xiàn)有注釋,并為未來玫瑰植物抗旱性的機理和功能研究奠定了基礎(chǔ)。
參考文獻:Wei Li, Lufeng Fu, Ziwen Geng, Xiaojuan Zhao, Qinghua Liu, Xinqiang Jiang, Physiological Characteristic Changes and Full-Length Transcriptome of Rose (Rosa chinensis) Roots and Leaves in Response to Drought Stress[J],?Plant and Cell Physiology, 2020.
]]>發(fā)表期刊:中國農(nóng)業(yè)科學
發(fā)表時間:2020年11月
影響因子:2.302
蜜蜂球囊菌(Ascosphaeraapis,簡稱球囊菌)是專性侵染蜜蜂幼蟲的致死性真菌病原,引發(fā)的白堊病是長期危害養(yǎng)蜂生產(chǎn)的頑疾,不僅可導(dǎo)致蜜蜂幼蟲的大量死亡,還能導(dǎo)致成年蜜蜂數(shù)量的銳減以及蜂群群勢和蜂產(chǎn)品產(chǎn)量的驟降。目前,球囊菌的基因組注釋信息尚不完善,高質(zhì)量參考轉(zhuǎn)錄組匱乏,嚴重限制了球囊菌的組學和分子生物學研究。
球囊菌菌株由福建農(nóng)林大學動物科學學院(蜂學學院)蜜蜂保護實驗室分離、純化和保存。純化得到的純凈菌絲樣品和孢子樣品經(jīng)液氮速凍后迅速轉(zhuǎn)移到-80℃超低溫冰箱保存?zhèn)溆?。利用納米孔長讀段測序技術(shù)對球囊菌的純化菌絲(Aam)和純化孢子(Aas)分別進行測序,將高質(zhì)量的三代測序數(shù)據(jù)混合后用于構(gòu)建全長轉(zhuǎn)錄組,并通過比對主流數(shù)據(jù)庫進行功能注釋,同時對球囊菌的長鏈非編碼RNA(longnon-codingRNA,lncRNA)進行鑒定和分析。
1、納米孔測序數(shù)據(jù)質(zhì)控
球囊菌菌絲和孢子的納米孔測序分別得到6321704和6259727條原始讀段,N50分別達到1094和1157bp,平均長度分別為992和1047bp,長的長度分別為9421和13060bp(表1)。來源于Aam和Aas的原始讀段的長度分布介于1-10kb以上,其中分布reads數(shù)多的長度均為1kb(圖1-A、1-B);原始讀段的Q值分布介于Q6-Q15,分布reads數(shù)多的質(zhì)量值分別為Q9和Q11(圖1-C、1-D)。
圖1球囊菌菌絲和孢子納米孔長讀段測序的原始讀段長度和質(zhì)量值分布Fig.1Lengthandqualitydistributionofrawreadsgeneratedfromnanoporelong-readsequencingofA.apismyceliumandspore
2、全長轉(zhuǎn)錄本的鑒定和分析
進一步過濾冗余全長有效讀段,分別得到9859和16795條非冗余全長轉(zhuǎn)錄本,N50分別達到1482和1658bp,平均長度分別達到1187和1303bp,長的長度分別為6472和6815bp(表2);上述非冗余全長轉(zhuǎn)錄本的長度介于1-7kb,其中分布在1kb的全長轉(zhuǎn)錄本數(shù)多。進一步對Aam和Aas的非冗余全長轉(zhuǎn)錄本進行Venn分析,結(jié)果顯示有6512個非冗余全長轉(zhuǎn)錄本為菌絲和孢子所共有,分別有3347和10283個非冗余全長轉(zhuǎn)錄本為二者特有(圖2-A)。
圖2球囊菌菌絲和孢子全長轉(zhuǎn)錄本的Venn分析(A)、全長轉(zhuǎn)錄本的Nr數(shù)據(jù)庫注釋(B)Fig.2Vennanalysisoffull-lengthtranscriptsinA.apismyceliumandspore(A)、Nrdatabaseannotationoffull-lengthtranscripts(B)
3、全長轉(zhuǎn)錄本的數(shù)據(jù)庫注釋
在球囊菌菌絲和孢子中共鑒定出20142條全長轉(zhuǎn)錄本,數(shù)據(jù)庫注釋結(jié)果顯示,分別有20809、11151、17723、12164、11340和9833全長轉(zhuǎn)錄本可注釋到Nr、KOG、eggNOG、Pfam、GO和KEGG數(shù)據(jù)庫。注釋全長轉(zhuǎn)錄本數(shù)量多的物種是球囊菌、Polytolypahystricis和莢膜組織胞漿菌(Histoplasmacapsulatum)(圖2-B)
4、lncRNA的鑒定及分析
利用CPC、CPAT、CNCI和Pfam4種方法依次鑒定出1906、1682、750和648條lncRNA,四者的交集為648個(圖3-A);其中基因間區(qū)lncRNA(longintergenicRNA,lincRNA)、反義鏈lncRNA(anti-senselncRNA)和正義鏈lncRNA(senselncRNA)的數(shù)量分別為480、119和49個(圖3-B)。
圖 3 球囊菌 lncRNA 的數(shù)量(A)和種類(B) Fig. 3 Number (A) and type (B) of A. apis lncRNAs
構(gòu)建和注釋了球囊菌的高質(zhì)量全長轉(zhuǎn)錄組,為探究球囊菌轉(zhuǎn)錄組的復(fù)雜性、完善參考基因組的序列和功能注釋信息以及深入開展球囊菌可變剪接體的功能研究提供了關(guān)鍵依據(jù)。
同期作者利用納米孔全長轉(zhuǎn)錄組測序數(shù)據(jù)對蜜蜂球囊菌(Ascosphaeraapis)和另一蜜蜂真菌病原東方蜜蜂微孢子蟲(Nosemaceranae)的現(xiàn)有參考基因組在結(jié)構(gòu)功能注釋上進行了較好的完善,同時也對基因的可變剪接(alternativesplicing,AS)和可變多聚腺苷酸化(alternativepolyadenylation,APA)進行解析。通過gffcompare軟件將全長轉(zhuǎn)錄本與參考基因組注釋的轉(zhuǎn)錄本進行比較,對基因組注釋基因的非編碼區(qū)向上游或下游延伸,修正基因的邊界。利用MISA軟件鑒定長度在500bp以上的全長轉(zhuǎn)錄本的簡單重復(fù)序列(simplesequencerepeat,SSR)位點信息。使用Blast工具將鑒定到的新基因和新轉(zhuǎn)錄本比對Nr、KOG、eggNOG、GO和KEGG數(shù)據(jù)庫,從而獲得功能注釋。通過Astalavista軟件鑒定基因的AS事件類型,統(tǒng)計分析可變剪切的結(jié)果。采用TAPISpipeline對基因的APA位點進行鑒定,得到APA的位點信息。分別利用CPC、CNCI、CPAT、Pfam4種方法對長鏈非編碼RNA(longnon-codingRNA,lncRNA)進行預(yù)測,取四者的交集作為高可信度的lncRNA。研究結(jié)果較好地優(yōu)化了現(xiàn)有的東方蜜蜂微孢子蟲和蜜蜂球囊菌參考基因組已注釋基因的結(jié)構(gòu)和功能注釋信息,并補充和注釋了大量參考基因組未注釋的新基因和新轉(zhuǎn)錄本,同時也為其他真菌的AS和APA研究提供了有益的思路和方法借鑒。
]]>2022年8月,百邁客合作客戶中南大學湘雅醫(yī)院眼科中心/湖南省眼科重點實驗室夏曉波教授團隊在《Nature》子刊《Cell Death & Differentiation》(IF:12.067,中科院一區(qū))發(fā)表了研究成果“Pathologically high intraocular pressure disturbs normal iron homeostasis and leads to retinal ganglion cell ferroptosis in glaucoma”(病理性高眼壓干擾正常鐵穩(wěn)態(tài)并誘導(dǎo)青光眼視網(wǎng)膜神經(jīng)節(jié)細胞鐵死亡),首次報道了鐵死亡與青光眼發(fā)病機制的研究。百邁客為該研究提供了ONT全長轉(zhuǎn)錄組建庫測序分析服務(wù)。
病理性高眼壓:青光眼是全球首位不可逆的致盲性眼病,可累及各年齡階段人群,臨床表現(xiàn)為進行性的視野缺損和視神經(jīng)損害,視網(wǎng)膜神經(jīng)節(jié)細胞(RGC,視網(wǎng)膜唯一的中樞傳入神經(jīng)元)的選擇性和不可逆性丟失是青光眼病理損害的基礎(chǔ)。病理性高眼壓(pathological high intraocular pressure,ph-IOP)是青光眼發(fā)病的重要特征,也是導(dǎo)致青光眼RGC丟失的主要因素。通過藥物或手術(shù)途徑降低青光眼患者的ph-IOP是目前臨床中治療青光眼的唯一有效方法,但單純控制ph-IOP并不能完全阻止青光眼RGCs的丟失,臨床中很多青光眼患者在Ph-IOP控制至正常水平后,RGC丟失和視野損害仍在繼續(xù),其具體的原因尚不完全清楚并存有爭議。
鐵死亡:是近幾年發(fā)現(xiàn)的一種新的細胞死亡方式,是在小分子物質(zhì)誘導(dǎo)下發(fā)生的氧化性細胞死亡,具有鐵離子依賴性,其發(fā)生是細胞內(nèi)脂質(zhì)活性氧(reactive oxygen species,ROS)生成與降解的平衡失調(diào)所致。鐵死亡誘導(dǎo)劑通過不同的通路直接或間接作用于谷胱甘肽過氧化物酶(glutathione peroxidase,GPXs),導(dǎo)致細胞抗氧化能力降低、ROS堆積、最終引起細胞氧化性死亡。鐵死亡不僅與眾多疾病的發(fā)生發(fā)展有關(guān),其相關(guān)信號通路上的關(guān)鍵蛋白也可成為藥物的作用靶點,多種鐵離子螯合劑以及親脂性自由基捕獲型抗氧化劑可以抑制這種細胞死亡
1)Ph-IOP損傷模型構(gòu)建:體內(nèi)模型–利用鹽水灌注系統(tǒng),增加小鼠眼球前房壓力,誘導(dǎo)Ph-IOP損傷;體外模型–R28細胞的氧糖剝奪/復(fù)氧(OGD/R)損傷模型;
2)ONT全長轉(zhuǎn)錄組測序:在ph-IOP損傷或假手術(shù)組(sham)誘導(dǎo)后24 h,收集小鼠視網(wǎng)膜,將4個單獨的視網(wǎng)膜合并為一個樣本,每組包含三個樣本,分別進行ONT全長轉(zhuǎn)錄組測序。
3)指標檢測:視網(wǎng)膜氧化應(yīng)激–丙二醛(MDA)、煙酰胺腺嘌呤二核苷酸磷酸酯還原形式(NADPH)和谷胱甘肽(GSH);高效液相色譜HLPC–檢測小鼠血清和視網(wǎng)膜的去鐵酮(DFP,脂溶性鐵螯合劑)給藥后的濃度;視網(wǎng)膜形態(tài)分析–H&E染色測量小鼠視網(wǎng)膜切片的形態(tài);鐵離子檢測–Perl’s染色法檢測視網(wǎng)膜各層中鐵的分布、使用Iron Assay Kit盒(MAK025;Sigma)測量血清和視網(wǎng)膜的鐵水平(總鐵、二價鐵和三價鐵);掃描透射電子顯微鏡TEM–測定RGCs具有鐵濃縮特征的線粒體。
1. 通過分析急性原發(fā)性閉角型青光眼(APACG,Ph-IOP損傷最典型的一類青光眼)患者外周血清鐵離子含量發(fā)現(xiàn),青光眼患者血清中三價鐵離子含量較正常人群升高,推測鐵代謝可能參與調(diào)控了ph-IOP條件下RGC的損傷過程;
2. 體外和體內(nèi)實驗證實了,ph-IOP可以在損傷早期導(dǎo)致細胞和視網(wǎng)膜內(nèi)二價鐵離子異常積累,損傷后8h血清中三價鐵離子水平升高;
3. 進一步研究發(fā)現(xiàn),核受體共激活劑4(NCOA4)介導(dǎo)的鐵蛋白重多肽1(FTH1)的降解是導(dǎo)致ph-IOP損傷后視網(wǎng)膜內(nèi)鐵代謝紊亂的重要原因,體內(nèi)敲低Ncoa4的表達可抑制FTH1的降解,并降低視網(wǎng)膜中二價鐵的水平;
4. ph-IOP導(dǎo)致的鐵代謝紊亂可以通過增加視網(wǎng)膜促鐵死亡因子的表達,減少抑鐵死亡因子的表達誘導(dǎo)RGC發(fā)生鐵死亡,加重青光眼損傷;去鐵酮口服后可有效通過血-視網(wǎng)膜屏障,ph-IOP損傷后螯合視網(wǎng)膜內(nèi)異常升高的二價鐵,抑制RGCs鐵死亡,保護視覺功能。
總之,該研究首次揭示了NCOA4-FTH1介導(dǎo)的鐵代謝紊亂及鐵死亡在青光眼RGCs損傷中的作用,證明了去鐵酮靶向抑制RGC鐵死亡對青光眼的治療作用,為從鐵穩(wěn)態(tài)及鐵死亡途徑理解和治療青光眼提供了新的研究方向。
1、Ph-IOP 損傷擾亂鐵穩(wěn)態(tài)
檢測 APACG 患者和健康對照者的血清鐵含量發(fā)現(xiàn),APACG 患者血清的總鐵和三價鐵水平高于健康對照組(圖1b),但二價鐵含量的變化并不顯著;與對照組相比,ph-IOP損傷體外模型組的細胞質(zhì)中二價鐵顯著積累。
在ph-IOP損傷或假手術(shù)組(sham)誘導(dǎo)后24 h的小鼠視網(wǎng)膜進行ONT全長轉(zhuǎn)錄組測序分析,結(jié)果顯示,在 ph-IOP 損傷后,29個鐵代謝相關(guān)基因的轉(zhuǎn)錄水平顯著改變(圖1d);此外,與正常小鼠相比,ph-IOP 損傷后1h和8h,視網(wǎng)膜和血清總鐵水平均升高(圖1e, f)。這些結(jié)果顯示ph-IOP 干擾了正常的鐵穩(wěn)態(tài),導(dǎo)致體內(nèi)和體外鐵離子的顯著積累,這主要發(fā)生在 ph-IOP 損傷后的早期。
圖1 ph-IOP損傷小鼠視網(wǎng)膜鐵穩(wěn)態(tài)分析
2、NCOA4介導(dǎo)的FTH1降解導(dǎo)致 ph-IOP 誘導(dǎo)鐵離子積累
鐵蛋白(Ferritin)是一種廣泛存在的儲鐵蛋白,在 ph-IOP 損傷后1小時,F(xiàn)TH1(Ferritin亞基)的水平急劇下降(圖2h),這與 ph-IOP 損傷后早期的鐵積累一致;鐵自噬(ferritinophagy)是一種調(diào)節(jié)細胞內(nèi)鐵代謝的選擇性自噬,檢測視網(wǎng)膜內(nèi)源性NCOA4(鐵自噬關(guān)鍵調(diào)節(jié)蛋白)蛋白水平發(fā)現(xiàn),pH-IOP 損傷后NCOA4與 FTH1之間的內(nèi)源性相互作用增強(圖2i, j);敲降Ncoa4后增加了視網(wǎng)膜 FTH1水平(圖2m-o),并伴隨著 ph-IOP 損傷后視網(wǎng)膜中二價鐵離子水平的降低(圖2p)。
圖2 NCOA4介導(dǎo)的FTH1降解導(dǎo)致 ph-IOP 誘導(dǎo)鐵離子積累
3、Ph-IOP損傷誘導(dǎo)鐵累積導(dǎo)致早期視網(wǎng)膜鐵死亡
為了驗證PH-IOP損失引起的視網(wǎng)膜鐵積累可能導(dǎo)致視網(wǎng)膜鐵死亡這一假設(shè),測量了氧化應(yīng)激相關(guān)生化指標,發(fā)現(xiàn)Ph-IOP損傷早期階段MDA含量顯著增加,而GSH和NADPH水平顯著降低;進一步檢測鐵死亡核心標志物GPX4(抑鐵死亡因子)和ACSL4(促鐵死亡因子)發(fā)現(xiàn),ph-IOP 損傷后24h,GPX4水平降低,在PH-IOP損傷后1h,ACSL4水平上調(diào)(圖3d-f);并且這些鐵死亡相關(guān)蛋白的變化主要集中在視網(wǎng)膜內(nèi)層,尤其是神經(jīng)節(jié)層(圖3g, h),提示鐵死亡誘導(dǎo)的細胞損傷可能集中在 RGC 中(位于視網(wǎng)膜最內(nèi)層);TEM檢測發(fā)現(xiàn)PH-IOP引起RGC線粒體收縮和線粒體膜密度增加,表明ph-IOP誘導(dǎo)的視網(wǎng)膜鐵累積導(dǎo)致視網(wǎng)膜鐵死亡,特別是在 RGC中。
圖3 Ph-IOP損傷誘導(dǎo)鐵累積導(dǎo)致早期視網(wǎng)膜鐵死亡
4、去鐵酮減少Ph-IOP損傷誘導(dǎo)的鐵離子累積
去鐵酮DPF作為鐵螯合劑目前已應(yīng)用于臨床治療鐵超負荷疾病,阻止患者血清鐵的蓄積。進一步研究DFP對ph-IOP損傷小鼠鐵代謝的影響。體內(nèi)體外結(jié)果顯示,DFP處理可以顯著降低 ph-IOP誘導(dǎo)的視網(wǎng)膜二價鐵累積;DFP治療可降低ph-IOP損傷后視網(wǎng)膜MDA含量(圖4a),增加GSH和NADPH水平(圖5b, c );此外,在ph-IOP損傷小鼠中,DFP處理恢復(fù)了GPX4水平,并降低了ACSL4水平(圖5d-e)。以上結(jié)果表明,DFP可以改善ph-IOP誘導(dǎo)的視網(wǎng)膜鐵死亡。
圖4 DFP減少Ph-IOP損傷誘導(dǎo)的鐵離子累積
5、DFP抑制ph-IOP 損傷引起的RGC鐵死亡
H&E染色結(jié)果顯示,Ph-IOP損傷導(dǎo)致顯著的RGC丟失和視功能損害;接著從形態(tài)學和功能上驗證了DFP對RGC的藥理作用,在 ph-IOP 損傷后5天,DFP處理減弱了神經(jīng)節(jié)細胞復(fù)合體(GCC)厚度,并增加了RGC數(shù)量(FG標記RGC形態(tài))。這些結(jié)果表明,DFP在ph-IOP損傷后保護 RGC 損傷,因此使用DFP抑制鐵死亡是治療ph-IOP誘導(dǎo)的RGC 損失的有效治療策略。
圖5 DFP抑制ph-IOP 損傷引起的RGC鐵死亡
在生理狀態(tài)下,細胞內(nèi)鐵處于動態(tài)平衡狀態(tài),但在病理狀態(tài)下,這種平衡會被打破。Ph-IOP 損傷可以激活RGC細胞內(nèi)的NCOA4,激活的NCOA4將結(jié)合FTH1并觸發(fā)溶酶體降解FTH1(稱為鐵自噬)。降解的FTH1會釋放大量的游離鐵離子,這種具有氧化還原活性的金屬會進一步參與脂質(zhì)過氧化。最終,由鐵引起的脂質(zhì)過氧化氫的積累導(dǎo)致RGC鐵死亡,但口服DFP可以螯合細胞內(nèi)多余的游離鐵離子,抑制ph-IOP誘導(dǎo)的RGC鐵死亡。
參考文獻
Yao F, Peng J, Zhang E, et al. Pathologically high intraocular pressure disturbs normal iron homeostasis and leads to retinal ganglion cell ferroptosis in glaucoma [published online ahead of print, 2022 Aug 6]. Cell Death Differ. 2022;10.1038/s41418-022-01046-4. doi:10.1038/s41418-022-01046-4
如果您對nanopore全長轉(zhuǎn)錄組技術(shù)感興趣,歡迎點擊下方按鈕聯(lián)系我們,我們將免費為您設(shè)計文章思路方案。
]]>英文題目:Long-read sequencing reveals the complex splicing profile of the psychiatric risk gene CACNA1C in human brain
發(fā)表雜志:Mol. Psychiatry,2020年1月
影響因子:11.973
在人腦中,與精神分裂癥相關(guān)的基因組區(qū)域富集了在神經(jīng)發(fā)育過程中表現(xiàn)出不同異構(gòu)體使用的基因,RNA剪接是將遺傳變異與精神疾病聯(lián)系起來的關(guān)鍵機制。剪接圖譜在大腦中特別多樣,很難準確識別和量化。短讀長RNA-Seq方法不能準確地重建和定量大多數(shù)轉(zhuǎn)錄物和蛋白質(zhì)異構(gòu)體,為解決這一挑戰(zhàn),本文將long-range PCR和nanopore全長轉(zhuǎn)錄組測序與一種新的生信分析流程結(jié)合。
CACNA1C是一種精神危險基因,編碼電壓門控鈣通道CaV1.2,CACNA1C基因很大而且很復(fù)雜,至少有50個注釋外顯子和31個預(yù)測的轉(zhuǎn)錄本。它的大小和復(fù)雜性使得用標準的基因表達方法準確鑒定和量化轉(zhuǎn)錄本變得極其困難,本文在人腦中鑒定了CACNA1C的全長編碼轉(zhuǎn)錄本,識別了38個新的外顯子和241個新的轉(zhuǎn)錄本,對異構(gòu)體多樣性的詳細了解對于將精神病學基因組發(fā)現(xiàn)轉(zhuǎn)化為病理生理學見解和新的精神藥理靶點至關(guān)重要。
樣本:來自利伯腦發(fā)育研究所儲存庫的三名成年捐贈者的尸檢腦組織(提取小腦、紋狀體、背外側(cè)前額葉皮質(zhì)、扣帶回、枕葉和頂葉皮質(zhì)的RNA,并進行逆轉(zhuǎn)錄)
測序方法:使用PCR擴增CACNA1C全長CDS,使用MinION進行測序
分析流程:https://github.com/twrze/TAQLoRe
1、CACNA1C有很多外顯子和異構(gòu)體
由于CACNA1C的復(fù)雜性,本文使用了兩種互補的方法來鑒定轉(zhuǎn)錄本:外顯子水平和剪接位點水平的分析,分析流程見補充圖2。該方法共鑒定了251種存在于人腦中獨特的CACNA1C轉(zhuǎn)錄異構(gòu)體,其中241種是新的,包括使用新的外顯子,新的剪接位點和連接。
在CACNA1C基因座內(nèi)總共注釋了39個潛在的新外顯子,其中38個在至少2個人或組織中被識別,并在每個文庫中得到至少5條nanopore reads的支持(圖2A)。通過PCR和Sanger測序確認了新的外顯子與其周圍的注釋外顯子之間的剪接連接,從而驗證了四個新的外顯子。這種新的外顯子的成功驗證提供了很高的可信度,即通過納米孔測序鑒定的新的外顯子是真實的,并且被整合到CACNA1C轉(zhuǎn)錄本中。表達量最高的10條轉(zhuǎn)錄本中,有9條是新的且其中有8條被預(yù)測保持CACNA1C閱讀框架,這表明這些最豐富的新轉(zhuǎn)錄本中有一些編碼功能不同的蛋白質(zhì)異構(gòu)體(圖2B,C)。這些結(jié)果表明,新的CACNA1C轉(zhuǎn)錄本表達豐富,數(shù)量也很多,目前的注釋缺少許多最豐富的CACNA1C轉(zhuǎn)錄本。
通過設(shè)置轉(zhuǎn)錄本的高置信度,在6個大腦區(qū)域確定了90個高可信的CACNA1C轉(zhuǎn)錄本,包括7個先前注釋的(GENCODE V27)和83個新的(補充圖3)。7個新的高置信度轉(zhuǎn)錄本包含新的外顯子,而其余76個包含以前未描述的連接和連接組合。
上述外顯子水平的轉(zhuǎn)錄本鑒定方法為鑒定新的外顯子和表征全長轉(zhuǎn)錄本結(jié)構(gòu)提供了穩(wěn)健和保守的手段。使用了更為保守的依賴于連接處無錯誤映射所支持的連接的識別,以及規(guī)范剪接位點的方法,確定了497個新的剪接位點,其中393個由至少10條reads支持,這些剪接位點,在篩選了至少24條reads支持的轉(zhuǎn)錄本后,鑒定了195個轉(zhuǎn)錄本,其中111個被預(yù)測為編碼的。
2、CACNA1C亞型在不同腦區(qū)的表達譜不同
小腦、紋狀體與皮質(zhì)等組織觀察到了CACNA1C轉(zhuǎn)錄本差異,但在不同個體之間的表達是相似的。在小腦中觀察到了明顯的轉(zhuǎn)錄本表達轉(zhuǎn)換;在小腦之外,ENST00000399641是主要的轉(zhuǎn)錄本,而在小腦中,ENST00000399641和CACNA1C n2199的表達水平相似。
3、預(yù)測新isoforms對CaV1.2蛋白模型的影響
CACNA1C編碼CaV1.2 的主要成孔亞基。鈣孔由24個跨膜重復(fù)序列組成,由細胞內(nèi)環(huán)連接成4個結(jié)構(gòu)域(I-IV)(圖4A)。在我們鑒定的83個新的外顯子水平的轉(zhuǎn)錄本中,51個可能編碼功能性的CaV1.2通道?;疑娇虮硎拘碌?、框架內(nèi)的插入和刪除的位置(值表示包含每個isoforms的reads的平均比例)。使用兩種分析方法(外顯子水平和剪切連接水平)鑒定變體的情況,外顯子水平計數(shù)用于得出豐度(紅色文本);僅使用剪接位點水平方法鑒定的變體用藍色文本表示。包含三個微缺失的蛋白質(zhì)異構(gòu)體的數(shù)量:(I)在I-II接頭中,(Ii)在IV4-5接頭中,以及(Iii)在IV3-4接頭中先前報道的微缺失(圖4B)。
長讀長測序技術(shù)的快速發(fā)展為準確獲得轉(zhuǎn)錄多樣性提供了可能,因為每一條read都包含一個完整的轉(zhuǎn)錄本。這對于具有復(fù)雜模型的基因尤其重要。由于CACNA1C剪接產(chǎn)生的CaV1.2蛋白對現(xiàn)有的鈣通道阻滯劑表現(xiàn)出不同的敏感性,因此有可能選擇性地針對疾病相關(guān)的CACNA1C亞型和/或那些在大腦與外周差異表達的CACNA1C亞型,提供既更有效又更無外周副作用的新型精神藥物。綜上,這些觀察結(jié)果證明了ONT長讀長測序?qū)τ跍蚀_描述轉(zhuǎn)錄本結(jié)構(gòu)和選擇性剪接的重要性。
參考文獻:
Clark Michael B,Wrzesinski Tomasz,Garcia Aintzane B et al. Long-read sequencing reveals the complex splicing profile of the psychiatric risk gene CACNA1C in human brain.[J] .Mol. Psychiatry, 2020, 25: 37-47.
]]>
ONT測序技術(shù)在多個方面具有非常強悍的優(yōu)勢,然而,一份合格的下機數(shù)據(jù)才是科研成功研究的基礎(chǔ),為保證得到準確的轉(zhuǎn)錄組結(jié)構(gòu)分析和定量結(jié)果,需要對測序數(shù)據(jù)進行嚴格的質(zhì)控評估。那么我們今天一起學習一下《Summary statistics and QC tutorial》,ONT官方提供的對測序raw?data進行全面數(shù)據(jù)質(zhì)控的教程。
此教程適用于指導(dǎo)對單個nanopore測序芯片產(chǎn)出的數(shù)據(jù)進行評估,評估的主要內(nèi)容如下所示:
1、測序產(chǎn)出(測序得到多少reads,多大數(shù)據(jù)量);
2、測序數(shù)據(jù)的質(zhì)量和長度分布;
3、如果加入了barcode序列進行混樣建庫,測序數(shù)據(jù)在不同樣品的分布。
直接到教程的github頁面下載或通過git命令下載:
git clone https://github.com/nanoporetech/ont_tutorial_basicqc.git QCTutorial
后續(xù)分析會用到下載目錄QCTutorial下的以下內(nèi)容:
1) Nanopore_SumStatQC_Tutorial.Rmd:Rmarkdown文件,說明文檔和用于執(zhí)行分析。
2) RawData/lambda_sequencing_summary.txt.bz2:示例文件,Guppy對測序reads進行堿基識別生成的相關(guān)信息文件。
3) RawData/lambda_barcoding_summary.txt.bz2:示例文件,用于區(qū)分混樣建庫時多樣品的barcode信息。
4) environment.yaml:指定分析所需軟件包及計算環(huán)境的文本文檔。
5) config.yaml:配置文件,用于指定分析所需的輸入。
2、創(chuàng)建Conda環(huán)境
為了方便執(zhí)行分析所需軟件包及其依賴的安裝及管理,需要安裝Conda并創(chuàng)建用于此分析的環(huán)境。
1)?Conda安裝(Python3版本的Miniconda):
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh
bash
2)?創(chuàng)建Conda環(huán)境及環(huán)境激活(第1步中下載的environmen.yaml用于環(huán)境初始化):
創(chuàng)建環(huán)境:conda env create –name BasicQC –file environment.yaml
激活環(huán)境:source activate BasicQC
進行分析之前需先準備配置文件,通過修改準備步驟下載的config.yaml中相應(yīng)的參數(shù)來完成,需要修改的內(nèi)容主要有:
修改內(nèi)容 | 內(nèi)容說明 | 示例 |
---|---|---|
inputFile | 堿基識別的統(tǒng)計信息 | sequencing_summary.txt.bz2 |
barcodeFile | 混樣建庫的barcode信息 | barcoding_summary.txt.bz2 |
basecaller | 堿基識別工具 | Guppy 2.1.3 |
flowcellId | 測序芯片ID | FAK41706 |
注:如為單樣品測序無barcode信息,則barcodeFile部分為空。
準備完成后,可以通過命令行啟動分析,命令如下:
R –slave -e ‘rmarkdown::render(“Nanopore_SumStatQC_Tutorial.Rmd”, “html_document”)’
如果習慣圖形界面操作,也可以通過Rstudio載入Rmarkdown文件執(zhí)行分析:
上述分析完成后會將分析結(jié)果存放至HTML文件,可用瀏覽器打開Nanopore_SumStatQC_Tutorial.html進行查看。對單個芯片約1M reads分析的部分結(jié)果展示如下(結(jié)果來自教程,堿基識別使用Guppy 2.1.3,根據(jù)識別序列的平均質(zhì)量值將其分為pass和fail兩種,質(zhì)量值閾值默認為7):
1、總結(jié)
展示了數(shù)據(jù)產(chǎn)出的總體情況(如下圖,本分析中堿基識別共產(chǎn)出991,715條序列,14.6G堿基)。
2、質(zhì)量長度
此部分展示了對識別出的所有序列質(zhì)量和長度信息的統(tǒng)計結(jié)果,包括序列的平均長度,N50和平均質(zhì)量,序列長度和質(zhì)量的密度分布等
3、測序表現(xiàn)
此部分內(nèi)容統(tǒng)計了隨測序時間變化,測序累計序列個數(shù),堿基個數(shù),測序速度和有效工作納米孔數(shù)等指標的變化情況。
4、區(qū)分混樣
在加入barcode序列混樣測序的情況下,barcode識別區(qū)分的結(jié)果展示如下,包括barcode識別效率,區(qū)分的文庫個數(shù)及每個文庫中序列個數(shù)占比和長度信息等。
上面展示了分析結(jié)果的部分內(nèi)容,更多細節(jié)的內(nèi)容可參考底部的相關(guān)鏈接。
rawdata的質(zhì)控評估只是整個信息分析的開始,是為了對測序數(shù)據(jù)有大致的整體認識,以便更好地指導(dǎo)后續(xù)分析。然而分析的每個環(huán)節(jié)都會對最終結(jié)果產(chǎn)生影響,因此每一步的處理都要深思熟慮。
2018年8月牛津納米孔公司與百邁客公司達成長期合作,擁有MinION、GridION X5和PromethION三種型號全套納米孔測序儀。至今已積累了豐富的項目經(jīng)驗,全長轉(zhuǎn)錄組成功案例先后發(fā)表在《Plant Biotechnol J》、《J Hazard Mater》、《Biotechnol Biofuels》、《Sci Rep》、《Fish & Shellfish Immunology》等國際知名期刊,已發(fā)表文章研究物種分別有楊樹、吳松草、風箏果、甘薯、野生甘薯、兔子、跳甲、花羔紅點鮭和辣椒,覆蓋領(lǐng)域分別為林木、哺乳動物、昆蟲、水產(chǎn)和作物等。
如您有任何全長轉(zhuǎn)錄組等相關(guān)問題,歡迎點擊下方按鈕,我們將竭盡全力為您答疑、設(shè)計方案和提供高分成功案例等。
參考鏈接:
https@//github.com/nanoporetech/ont_tutorial_basicqc(@換成:)
https@//community.nanoporetech.com/knowledge/bioinformatics(@換成:)
]]>
1、材料和方法
材料:3只新西蘭母兔,分別取21日齡、49日齡、84日齡,7個不同部位的組織器官(腦、心臟、肺、肝、脾、腸竇、后腿骨骼?。?1個樣本,分別提取RNA,等量RNA混合為單個樣品,分別進行二代和三代測序。
測序策略:
二代測序:Illumina平臺、PE150測序;
三代測序:構(gòu)建0–1, 1–2, 2–3, 3–6 和5–10 kb五個文庫,PacBio RS II平臺測序,共測13個SMRT Cell
方法和思路:“3+2”測序模式,對混合的RNA進行測序,獲得高可信度的轉(zhuǎn)錄本,完善參考基因組注釋,比較三代全長轉(zhuǎn)錄組測序和二代轉(zhuǎn)錄組測序在旁系同源基因的還原上的優(yōu)勢,由此說明通過PacBio鑒定得到的轉(zhuǎn)錄本能夠更好的注釋基因以及還原基因結(jié)構(gòu)。
2、結(jié)果與分析
2.1三代測序和糾錯
共獲得802,358個ROIs序列,其中有1.466,034全長非嵌合(FL)序列和316,000非全長(nFL)序列。
同時,二代測序獲得~120百萬clean reads,這些序列用來對三代的測序結(jié)果進行校正,顯示總共135,178個序列(86.2%)被二代測序數(shù)據(jù)校正,錯誤片段的長度比例相對較低(中位數(shù)8%)。
Figure 1.ROIs的分類和糾錯
2.2 可變剪接和聚腺苷酸化
PacBio鑒定到多達24,797個AS事件,并對這些可變剪接進行分類統(tǒng)計(Table 1),在兔的參考基因組中僅發(fā)現(xiàn)2,398個AS事件,將數(shù)據(jù)合并后共得到34,173個AS事件,且可變剪接事件包含不同的4中類型,另外,鑒定到11,184個APA事件。挑選5個基因,并用圖表示出不同的isoform比對到參考基因模型上(Figure 2)。
Table 1.可變剪接事件分析(IR:內(nèi)含子保留;ES:外顯子跳躍;Alt.5’:可變的5’端;Alt.3’:可變的)
Figure 2. 三代測得轉(zhuǎn)錄本的不同isoforms,在數(shù)據(jù)庫中的參考基因模型如圖示中被標記有染色體位置、基因ID和基因名稱
2.3 與已知參考基因比對分析
通過對PacBio鑒定到的轉(zhuǎn)錄本的分析發(fā)現(xiàn),有3,334個基因位點包含了3,637個轉(zhuǎn)錄本在參考基因中沒有注釋,并且有12,112個轉(zhuǎn)錄本被注釋到參考基因的內(nèi)含子上,這些新發(fā)現(xiàn)的轉(zhuǎn)錄本大部分長度為1000~2000bp。
2.4 非編碼RNA分類
通過比對到參考蛋白數(shù)據(jù)庫,有30,183個轉(zhuǎn)錄本可編碼蛋白、6,003個轉(zhuǎn)錄本不能編碼蛋白,并且這些非編碼的轉(zhuǎn)錄本外顯子少、表達量低、且外顯子與內(nèi)含子在長度上的比值相較于可編碼蛋白的轉(zhuǎn)錄本略高(Figure 3)。對轉(zhuǎn)錄本進行分類(Table 2)。
對非編碼轉(zhuǎn)錄本基因進行分類,1,794個為基因間區(qū)、3,558個基因定位于可編碼轉(zhuǎn)錄本。
Figure 3.可編碼和非編碼轉(zhuǎn)錄本比較
Table 2. 分類非編碼轉(zhuǎn)錄本(U:上游;D:下游;E:外顯子;I:內(nèi)含子)
2.5 旁系同源基因分析
選擇10個主要組織相容性復(fù)合體(MHC)旁系同源基因,這些基因都被注釋在1.2-Mbp的12號染色體上(Figure 4)。結(jié)果顯示除了HLA-A之外,與參考基因組注釋相比,PacBio轉(zhuǎn)錄本的所有基因結(jié)構(gòu)都得到很好得恢復(fù)。 此外,PacBio數(shù)據(jù)還支持很多尚未注釋的轉(zhuǎn)錄本。所有的這些同源基因由于其轉(zhuǎn)錄本序列非常相似,很難通過二代組裝的方式都還原,而三代測序方式能夠很好地鑒定出旁系同源基因。
Figure 4.基因通過PacBio所測轉(zhuǎn)錄本和組裝得到的轉(zhuǎn)錄本還原10個MHC基因。染色體定位、命名和每個基因的Ensembl編號(在左側(cè))。
如圖所示:從上到下排列依次為,Ensembl中的參考轉(zhuǎn)錄本(黑色),外顯子-內(nèi)含子結(jié)構(gòu)通過一個個方框分開;PacBio transcripts(紅色);Cufflinks(綠色)和Trinity(褐色)為組裝的轉(zhuǎn)錄本。
3、總結(jié)
二代測序由于短read組裝的困難,獲得全長轉(zhuǎn)錄本仍然是一個巨大的挑戰(zhàn)。在本研究中采用PacBio單分子長讀長測序技術(shù),用于繪制兔的轉(zhuǎn)錄本圖譜。結(jié)果提供了一整套全面的轉(zhuǎn)錄本參考數(shù)據(jù)集,從而有助于改進兔基因組的注釋。
參考文獻
Chen S Y, Deng F, Jia X, et al. A transcriptome atlas of rabbit revealed by PacBio single-molecule long-read sequencing[J]. Scientific Reports, 2017, 7(1):7648.
]]>