導(dǎo)讀
非酒精性脂肪性肝病(NAFLD)的3D基因組和基因組變異在很大程度上是未知的,盡管它們在細(xì)胞功能和生理過程中起著關(guān)鍵作用。在正常和NAFLD小鼠的肝臟上進(jìn)行高通量染色體構(gòu)象捕獲(Hi-C)、ONT測序和rna測序(RNA-seq)測定。生成高分辨率3D染色質(zhì)相互作用圖,通過Hi-C檢測不同的3D基因組層次結(jié)構(gòu),包括A/B區(qū)室、拓?fù)湎嚓P(guān)結(jié)構(gòu)域(TADs)和染色質(zhì)環(huán),并檢測結(jié)構(gòu)變異(SVs)和拷貝數(shù)變異(CNVs)的全基因組測序。在正常和NAFLD小鼠間,發(fā)現(xiàn)了基因組中數(shù)千個(gè)區(qū)域在3D染色質(zhì)組織和基因組重排方面的變化,并揭示了基因調(diào)節(jié)異常經(jīng)常伴隨這些變化。在NAFLD中發(fā)現(xiàn)了候選靶基因,受基因重排和空間組織破壞的影響。作者的數(shù)據(jù)為NAFLD研究提供了高分辨率的三維基因組相互作用資源,揭示了遺傳重排、空間組織破壞和基因調(diào)控之間的關(guān)系,并確定了與NAFLD發(fā)病機(jī)制中這些變異相關(guān)的候選基因。這些新發(fā)現(xiàn)為NAFLD的發(fā)病機(jī)制提供了新的見解,并為NAFLD的治療提供了新的概念框架。
背景介紹
非酒精性脂肪性肝病(NAFLD)是一種常見的慢性肝臟疾病,與肝臟脂肪堆積有關(guān)。鑒于NAFLD發(fā)病機(jī)制的復(fù)雜性,個(gè)體基因的變異并不能在疾病的發(fā)生中起決定性作用。全基因組分析和NAFLD候選基因的披露將提高對NAFLD病理生理學(xué)的理解。rna測序(RNA-seq)和全基因組測序(WGS)是目前廣泛應(yīng)用于深入了解疾病的技術(shù)。測序技術(shù)的重大進(jìn)步使得RNA-seq和WGS在確定肝臟疾病的分子發(fā)病機(jī)制方面得以實(shí)現(xiàn)。ONT測序作為第三代測序方法,具有較高的測序通量和更長的讀取長度,允許對整個(gè)基因組進(jìn)行全面分析,并識(shí)別大量的結(jié)構(gòu)變異(SVs)和拷貝數(shù)變異(CNVs)。ONT測序廣泛應(yīng)用于“組學(xué)”科學(xué),如基因組學(xué)、表觀基因組學(xué)和轉(zhuǎn)錄組學(xué),以評(píng)估參與疾病過程的單個(gè)或多個(gè)基因的突變狀態(tài)。sv通常存在于基因組中,但它們的功能影響往往難以捉摸。SV事件可能伴隨著染色體三維(3D)結(jié)構(gòu)的改變,破壞基因結(jié)構(gòu),導(dǎo)致疾病。
3D基因組的改變可能會(huì)影響許多關(guān)鍵的生物功能,它們與疾病發(fā)展的機(jī)制聯(lián)系日益明顯。在過去的幾年里,已經(jīng)進(jìn)行了一些關(guān)于3D癌癥基因組的研究。在一些腫瘤抑制基因中,包括但不限于磷酸酶和緊張素同源物(PTEN)、腫瘤蛋白p53 (TP53)、RB轉(zhuǎn)錄輔抑制因子1 (RB1)、notch受體1 (NOTCH1)和神經(jīng)纖維蛋白1 (NF1),序列或啟動(dòng)子經(jīng)常會(huì)因易位和反轉(zhuǎn)而中斷導(dǎo)致失活和隨后的癌癥發(fā)作和進(jìn)展。這些技術(shù)的整合有可能彌合基因組結(jié)構(gòu)和基因功能之間的差距,從而對NAFLD有更深入的了解。
材料方法
無NAFLD小鼠(對照組,C)和有NAFLD小鼠(模型組,M)的肝臟樣本。
技術(shù):Hi-C測序、ONT全基因組測序、RNA-seq、qPCR
結(jié)果
1、NAFLD小鼠肝臟轉(zhuǎn)錄組
誘導(dǎo)小鼠發(fā)生NAFLD,結(jié)果顯示血清ALT、AST、TC、TG、FFA水平顯著升高;MDA、SOD和GSH水平的變化表明模型組小鼠肝臟的氧化應(yīng)激狀態(tài)(圖1A)。通過H&E染色和油紅O染色觀察模型組肝組織病理改變和脂質(zhì)堆積情況(圖1B)。
肝臟樣本的不同生物重復(fù)之間的高度相似性如圖1C所示??紤]所有重復(fù),通過FPKM分析鑒定了2163個(gè)差異表達(dá)基因。在差異表達(dá)基因中,2100個(gè)基因被用于研究,這些基因可被注釋為差異表達(dá)基因(DEGs),包括1251個(gè)上調(diào)基因和849個(gè)下調(diào)基因在NAFLD小鼠中。利用GO和KEGG數(shù)據(jù)庫對獲得的差異表達(dá)基因進(jìn)行富集分析,富集程度*高的前10個(gè)GO和前20個(gè)KEGG通路分別如圖。這些結(jié)果表明在NAFLD肝臟轉(zhuǎn)錄組中存在很大比例的擾動(dòng),其中大多數(shù)與糖脂代謝相關(guān)的蛋白質(zhì)編碼基因失調(diào)。作者選擇一個(gè)差異表達(dá)基因的子集進(jìn)行qPCR驗(yàn)證所選基因的表達(dá)水平結(jié)果。
2、繪制三維染色質(zhì)構(gòu)象
為了獲得三維染色質(zhì)構(gòu)象圖,作者對肝臟樣本的Hi-C文庫進(jìn)行了測序,每組總共獲得超過477 Gb的數(shù)據(jù)。在去除PCR重復(fù)位點(diǎn)后,每個(gè)樣本獲得了超過8.02億對有效Hi-C數(shù)據(jù),測序深度為68.56%和68.96%,能夠以10 kb分辨率檢查C組和M組的相互作用。順反式相互作用的比例顯示,約四分之三的相互作用發(fā)生在染色體內(nèi),四分之一的相互作用發(fā)生在染色體間質(zhì)(圖2A)。,這個(gè)頻率可以揭示染色體在基因組中的相互作用強(qiáng)度和染色體在細(xì)胞核中的相對位置。染色體之間的相互作用頻率熱圖如圖2C所示。通過熱圖顏色由對照組的藍(lán)色變?yōu)镹AFLD組的淺紅色,可以發(fā)現(xiàn)染色體Chr2與Chr5之間相互作用頻率的差異,提示NAFLD組兩染色體之間距離較近,相互作用較強(qiáng)。相比之下,觀察到的顏色從紅色變?yōu)樗{(lán)色,表明NAFLD組染色體之間的空間距離更遠(yuǎn),相互作用更弱,如Chr 7和Chr 11之間的相互作用。將各組的兩個(gè)Hi-C庫結(jié)合起來,進(jìn)行對照組與模型組的對比分析。根據(jù)任意兩個(gè)bin之間覆蓋的Hi-C讀對的歸一化相互作用信號(hào)強(qiáng)度,繪制全基因組相互作用矩陣(圖2D),染色體內(nèi)相互作用矩陣如圖所示。

圖2?用Hi-C繪制對照組和NAFLD組小鼠肝組織三維染色質(zhì)構(gòu)象圖。(A)從對照組和NAFLD小鼠獲得的Hi-C庫中順式和反式相互作用的分布比例。
3、NAFLD中A/B區(qū)和相關(guān)DEGs的變化鑒定
Hi-C生成的高分辨率資源可以在多個(gè)尺度上探索NAFLD肝細(xì)胞中任何基因組位點(diǎn)的物理環(huán)境變化,如A/B區(qū)室、TAD、染色質(zhì)環(huán)等。通過PCA將染色質(zhì)分離成A/B區(qū),以了解NAFLD肝臟基因組中染色質(zhì)相互作用模式的差異。每個(gè)樣本染色體上A/B區(qū)室的分布如圖3A。對照組肝臟基因組共鑒定出714個(gè)A區(qū)(42.93%)和722個(gè)B區(qū)(49.65%),NAFLD肝臟基因組共鑒定出819個(gè)A區(qū)(42.64%)和821個(gè)B區(qū)(49.92%)。正常和NAFLD條件下的區(qū)室高度相關(guān),NAFLD誘導(dǎo)后僅2.34%的基因組發(fā)生切換(圖3E)。A/B開關(guān)區(qū)在每個(gè)染色體中的分布如圖3F所示。在所有染色體中共發(fā)生447次A/B室切換事件,其中226次A到B切換,221次B到A切換,Chr 9和Chr 13發(fā)生的室切換次數(shù)*多。將基因表達(dá)(RNA-seq)與HiC定義的A/B切換區(qū)進(jìn)行比較,發(fā)現(xiàn)A/B區(qū)變化與基因表達(dá)之間存在相關(guān)性(圖S4D)。通過篩選實(shí)驗(yàn)組之間與A/B室切換相關(guān)的38個(gè)DEGs,發(fā)現(xiàn)NAFLD組中B-A室DEGs上調(diào)94.12%,A-B室DEGs下調(diào)33.33%。作者篩選了16個(gè)與B-A室開關(guān)相關(guān)的上調(diào)deg和4個(gè)與A-B室開關(guān)相關(guān)的下調(diào)差異基因。

圖3通過Hi-C和RNA-seq檢測NAFLD小鼠肝臟A/B區(qū)及相關(guān)DEGs的變化。
4、鑒定TADs和相關(guān)deg的變化非酒精性脂肪肝
作者用TadLib軟件在20kb分辨率下識(shí)別TADs。在對照組和模型組TAD比較中,作者在對照組中發(fā)現(xiàn)了8179個(gè)TAD,在NAFLD組中發(fā)現(xiàn)了7818個(gè)TAD,其TAD大小中位數(shù)為180 kb。TAD結(jié)構(gòu)分析表明,TADs具有穩(wěn)定的染色質(zhì)結(jié)構(gòu)特征。方向性指數(shù)(DI)衡量了給定感興趣區(qū)域接觸方向的不平衡46,并與TAD邊界有關(guān),TAD邊界顯示出從上游到下游DI的強(qiáng)烈轉(zhuǎn)移特征(圖4A)。作者在對照組和NAFLD中分別識(shí)別出9390和9246個(gè)TAD邊界,其中538個(gè)為特殊控制邊界,394個(gè)為模型組邊界)。TADs在對照組和NAFLD組之間高度相關(guān),只有大約5%的TAD邊界在NAFLD發(fā)展過程中發(fā)生改變。TADs在基因表達(dá)調(diào)控中發(fā)揮重要作用,繪制了與差異TAD邊界相關(guān)的DEGs,并分析了它們的數(shù)量。圖4E所示為各組唯一TAD邊界及兩組不變邊界相關(guān)的deg。NAFLD的基因表達(dá)受到TAD邊界變化的影響,如圖4F中紅色陰影的染色體區(qū)域,以及圖4F中藍(lán)色陰影所示區(qū)域的交替。鑒定出42個(gè)上調(diào)基因和30個(gè)下調(diào)基因(支持信息圖S5和表S11)。這些結(jié)果表明,由于與NAFLD發(fā)展相關(guān)的新的TAD邊界的形成和消失,轉(zhuǎn)錄譜發(fā)生了改變。
5、染色質(zhì)環(huán)及其相關(guān)變化的鑒定NAFLD中的DEGs
除了短程染色質(zhì)相互作用外,3D基因組組織中的遠(yuǎn)程環(huán)帶來了兩個(gè)線性分離的位點(diǎn)之間的物理接近。作者通過Hi-C接觸矩陣使用改進(jìn)的HICCUP方法注釋染色質(zhì)環(huán),分辨率為10 kb。結(jié)果顯示,與NAFLD發(fā)展相關(guān)的環(huán)的總數(shù)減少(從39,670到38,469,圖5A),而環(huán)的大小沒有變化(環(huán)的中位數(shù)長度為70 kb,支持信息圖S6A。每條染色體的環(huán)分布如圖5B和C所示,Chr 1上的環(huán)分布*多,對照組和模型組分別有3193個(gè)和3099個(gè)環(huán)(圖5B)。

圖4 Hi-C和RNA-seq檢測NAFLD小鼠肝臟中TADs及受TADs影響的DEGs的變化

圖5 Hi-C和RNA-seq檢測NAFLD中染色質(zhì)環(huán)及相關(guān)DEGs的變化

圖6ONT測序鑒定的NAFLD結(jié)構(gòu)變異(SV)變化。
經(jīng)分析,與對照組相比,NAFLD組無啟動(dòng)子和增強(qiáng)子的環(huán)數(shù)增加,在增強(qiáng)子和啟動(dòng)子上有錨點(diǎn)的環(huán)數(shù)減少(圖5D和E)。作者確認(rèn)對照組有1924個(gè)特異性環(huán),模型組有723個(gè)特異性環(huán),F(xiàn)DR閾值為0.1(圖5A和支持信息表S12)。結(jié)合RNA-seq數(shù)據(jù)研究了環(huán)變異與基因表達(dá)之間的關(guān)系,98個(gè)已映射的DEGs被染色質(zhì)環(huán)變異調(diào)控,包括48個(gè)上調(diào)基因和50個(gè)下調(diào)基因。對這些環(huán)路影響的DEGs進(jìn)行GO富集和KEGG分析,確定了參與新生脂肪形成的標(biāo)志性基因,如酰基輔酶a去飽和酶1 (Scd1)和超長鏈脂肪酸蛋白6 (Elovl6)的延伸,它們在NAFLD中的表達(dá)下調(diào)。另一方面,在作者的研究中,形成異源二聚體并促進(jìn)膽固醇流入膽汁47的atp結(jié)合盒亞家族G成員5和8 (Abcg5和Abcg8)以及在晚期NAFLD45中報(bào)道的Fgfr2的水平在NAFLD中上調(diào)。這些發(fā)現(xiàn)表明染色質(zhì)環(huán)在NAFLD細(xì)胞代謝事件中的潛在作用。
6、通過ONT測序鑒定NAFLD中的SVs
ONT測序用于對NAFLD小鼠基因組變異進(jìn)行測序。經(jīng)過質(zhì)量控制,從對照和模型樣本(每組n z3個(gè))中獲得643.97 Gb清潔數(shù)據(jù),平均清潔數(shù)據(jù)量為107.33 Gb。N50值為9.89 kb,讀取的平均長度大于6.95 kb(支撐信息表S14)。根據(jù)參考基因組,每個(gè)樣本的映射率均在99.04%以上。測序深度和讀取覆蓋率的分布顯示了可接受的測序隨機(jī)性(圖6A和B,支持信息圖。S7B和S8)。實(shí)驗(yàn)組中,有381個(gè)deg與差異sv重疊,其中與DEL重疊201個(gè)deg,與INS重疊99個(gè)deg,與INV重疊188個(gè)deg(輔助信息表S17)?;诨蚬δ?,作者發(fā)現(xiàn)14個(gè)svv影響的DEGs參與脂質(zhì)運(yùn)輸和代謝(Acaca、Acsl5、Cbr3、Ces1f、Ces1g、Cryl1、Dgka、Dgkb、Dgkk、Idi1、Nlgn1、Nlgn3、Sugct和Hao2), 8個(gè)svv影響的DEGs與能量產(chǎn)生和轉(zhuǎn)換相關(guān)(Bckdhb、Me1、Hao2、Mt-co3、Mt-nd4、Nnt、Slc1a1和Slc1a2)。一些sv影響的DEGs與NAFLD相關(guān),這些結(jié)果暗示SVs通過影響基因調(diào)控和染色質(zhì)組織參與NAFLD的發(fā)展。

圖7通過Hi-C、Nanopore、RNA測序綜合分析,Gsta1和Camk1d為染色質(zhì)結(jié)構(gòu)重組引起NAFLD的候選致病基因。?
7、通過ONT測序鑒定NAFLD中的CNVs
DNA片段的刪除或復(fù)制導(dǎo)致拷貝數(shù)變異(CNVs),這是基因組中正常和致病變異的重要來源。每個(gè)樣本中發(fā)現(xiàn)了大約150個(gè)CNVs,包括損失、增益和擴(kuò)增。結(jié)合RNA-seq結(jié)果鑒定了對照組和NAFLD組之間的差異CNVs, 22個(gè)具有差異CNVs的deg(包括12個(gè)上調(diào)基因和10個(gè)下調(diào)基因)與NAFLD有關(guān)。在比較sv影響的DEGs時(shí),同時(shí)鑒定出Cntnap2、Mrgpra2b、Hist1h4n、Hist1h2br、Hist1h2ao、Pde4b、Gsta1、Gm3776、Kcnh1和Camk1d中的CNV變異。在Gsta1位點(diǎn)發(fā)現(xiàn)CNV差異,在NAFLD組中表達(dá)增加。由此可見,NAFLD的基因調(diào)控機(jī)制與染色質(zhì)微環(huán)境的差異有關(guān)。
8、NAFLD中染色質(zhì)結(jié)構(gòu)重組引起的致病基因候選
將Hi-C、Nanopore數(shù)據(jù)與NAFLD中的DEGs進(jìn)行整合,并通過RNA-seq、Hi-C和Nanopore測序結(jié)果的綜合分析篩選出所有受3D無序或重排影響的DEGs。與A/B區(qū)SVs、TAD、染色質(zhì)環(huán)和/或CNV相關(guān)的DEGs。在基因本體注釋中篩選出了與NAFLD發(fā)病機(jī)制相關(guān)的、存在基因組結(jié)構(gòu)變異的DEGs作為潛在的候選基因,這些基因可能有助于NAFLD的發(fā)生。Elovl6下調(diào)與TAD和loop中3D結(jié)構(gòu)的重組相關(guān)。Camk1d表達(dá)下調(diào),并受到CNV和SV、染色質(zhì)環(huán)、結(jié)構(gòu)域和相互作用矩陣的改變的全面影響。這些結(jié)果表明了三維基因組層次結(jié)構(gòu)各個(gè)層次的功能相關(guān)性,三維基因組的建立提供了多個(gè)調(diào)控層來改變NAFLD發(fā)展中的基因表達(dá)。
結(jié)論
1、NAFLD的肝損傷伴有基因表達(dá)的改變和肝臟轉(zhuǎn)錄組的潛在重塑。證據(jù)表明不同的3D基因組層次結(jié)構(gòu)具有功能相關(guān)性,3D基因組組織提供了多個(gè)額外的調(diào)控層來控制基因表達(dá)。
2、TADs是染色體的基本單位,是保守于組織和物種之間的自我接觸結(jié)構(gòu)域。在NAFLD中,在繪制TADs圖時(shí),大多數(shù)TADs是保守的,然而大約5%的TAD邊界在NAFLD誘導(dǎo)下被破壞。篩選到變化的TADs的DEGs,并觀察到參與新生脂肪形成的標(biāo)志基因Elovl6的下調(diào)與NAFLD的TAD變化有關(guān)。Plxnb1,一種肝臟腫瘤形成的抑制因子,在NAFLD中是taimpimpacted下調(diào)的DEG。
3、確定了兩組之間染色質(zhì)環(huán)的差異和98個(gè)與環(huán)變化相關(guān)的DEGs。受tad影響的基因Elovl6和Plxnb1也受到染色質(zhì)環(huán)變化的影響。環(huán)擠壓可能是導(dǎo)致TADs的一個(gè)機(jī)械方面。
考慮到以上因素,本研究采用了一種長讀的ONT測序方法。作者鑒定了基因組中的所有SVs和cnv,并檢索了與NAFLD中差異SVs和cnv相關(guān)的deg。確定了381個(gè)sv影響的和23個(gè)cnv影響的與NAFLD發(fā)展相關(guān)的DEGs, Camk1d、Pde4b和Gsta1基因的調(diào)控異常是由于sv和cnv在其位點(diǎn)上的存在。此外,包括Plce1、Plxnb1、Fgfr2、Grm8、Kcnma1和sugt在內(nèi)的DEGs位點(diǎn)周圍的基因組重排(SV或CNV)伴隨著不同3D基因組層次結(jié)構(gòu)的破壞。這表明在三維染色質(zhì)構(gòu)象、基因組和轉(zhuǎn)錄調(diào)控中存在共同的機(jī)制,并可能影響NAFLD的肝細(xì)胞表型。
展望
目前的工作有一些局限性。三維基因組在NAFLD核過程中的調(diào)控作用有待進(jìn)一步闡明。未來需要進(jìn)行基因組編輯研究,以確定打亂各種3D組織特征的功能后果,以闡明3D基因組破壞導(dǎo)致NAFLD的機(jī)制。此外,破譯由組蛋白修飾、DNA甲基化和非編碼rna介導(dǎo)的表觀遺傳機(jī)制的組合是√確定遺傳重排和空間組織破壞所必需的,并可能揭示NAFLD的新機(jī)制和確定新的治療靶點(diǎn)。
如果您對該研究思路感興趣,歡迎點(diǎn)擊下方按鈕聯(lián)系我們,我們將免費(fèi)為您設(shè)計(jì)文章思路方案