DNA甲基化是重要的表觀遺傳學(xué)標(biāo)記信息,獲得全基因組范圍內(nèi)所有C位點的甲基化水平數(shù)據(jù),對表觀遺傳學(xué)的時空特異性研究具有重要意義。Bisulfite甲基化測序是以新一代高通量測序平臺為基礎(chǔ),結(jié)合全基因組Bisulfite處理和生物信息數(shù)據(jù)分析技術(shù),進(jìn)行低成本、高效率、高準(zhǔn)確度的全基因組DNA甲基化水平圖譜繪制。
堿基類型分布
堿基類型分布檢查用于檢測有無AT、GC分離現(xiàn)象。若無bisulfite處理,高通量所測序列為基因組隨機(jī)打斷后的DNA片段,由于位點在基因組上的分布是近似均勻的,同時,G/C、A/T含量也是近似均勻的。全基因組甲基化項目中經(jīng)過bisulfite處理后的基因組中大部分的C位點變成T位點,因此其中一條鏈出現(xiàn)T的含量增加而C的含量劇減,同時對應(yīng)的反向鏈出現(xiàn)A的含量增加而G的含量減少。
5mC檢測
5mC的檢測主要使用Bismark軟件工具包實現(xiàn)。由于樣品經(jīng)過重亞硫酸處理,基因組上所有的未甲基化的C位點轉(zhuǎn)換成了U;經(jīng)過PCR擴(kuò)增U->T;即基因組上未甲基化的C轉(zhuǎn)化成了T;而原本甲基化的C;沒有改變;相應(yīng)的負(fù)鏈G->A;bismark是專門用于甲基化處理的比對軟件;他會對reads進(jìn)行轉(zhuǎn)變;根據(jù)Clean Reads在參考基因組的最佳的比對結(jié)果,提取全基因組胞嘧啶(C)位點的比對堿基信息,最終得到5mC位點覆蓋統(tǒng)計。
染色體水平甲基化分布圖譜
在每條染色體上,以100K大小為一窗口來計算每個窗口的甲基化水平,繼而從染色體水平描述甲基化 C 堿基的分布情況,繪制全基因組染色體水平甲基化圖譜,可以很直觀的呈現(xiàn)出染色體某個區(qū)域甲基化水平。
高甲基化CGI區(qū)域注釋
對高甲基化密度的CGI區(qū)域進(jìn)行注釋,區(qū)域甲基化水平大于0.7我們認(rèn)為是高甲基化的CGI區(qū)域;同時我們把覆蓋度大于5X的C位點認(rèn)為是可信度較高的位點,去除CGI 區(qū)域內(nèi)可信度較高的C位點的比例小于0.1的CGI區(qū)域;對剩下的區(qū)域進(jìn)行注釋;取基因上游3000bp為promoter區(qū),進(jìn)行overlap注釋。
DMR相關(guān)GO基因分類注釋
DMR相關(guān)基因GO注釋分類統(tǒng)計圖,直觀的反映出在生物過程(biological process)、細(xì)胞組分(cellular component)
和分子功能(molecular function),所有基因和差異基因注釋GO term的個數(shù)分布。可深入挖掘DMR相關(guān)基因的功能及所在的信號通路,篩選關(guān)注差異基因注釋情況。
DMR關(guān)聯(lián)基因代謝通路分析
生物體內(nèi),某些基因位點受到甲基化修飾之后,會影響該基因的表達(dá),從而改變生物學(xué)表型。因此,對DMR關(guān)聯(lián)基因分別進(jìn)行GO和KEGG注釋及富集分析,有助于深入挖掘甲基化修飾引起的生物學(xué)功能變化。
答:.DMR是用Bisulfighter軟件檢測的,詳細(xì)可以參考Bisulfighter的相關(guān)文獻(xiàn)(Bisulfighter:accuratedetectionofmethylatedcytosinesanddifferentiallymethylatedregions)。DMR是差異甲基化區(qū)域,長度不固定,長度為1KB的DMR中的任意一段不一定是DMR,如果取得的任意一段沒有甲基化的差異就不是DMR,如果有多個DMR連在一起,我們便將這些DMR合并成一個大的DMR。
答:甲基化水平計算方法共分四種:
1)單個位點甲基化水平:
單個位點的甲基化水平=支持甲基化C的reads數(shù)/總的reads數(shù)
注: 對于參考基因組上的C位點,有些reads(reads上此位置處是C)支持此位點是甲基化的C位點,有些reads不支持(reads上此位置是T), 那么單個位點的甲基化水平就是支持甲基化的reads數(shù)/(支持甲基化的reads數(shù)+不支持甲基化的reads數(shù))
計算得到單個位點的甲基化水平后,我們用二項分布檢驗判斷某位點是否為甲基化C位點。
用從左開始第二個C計算單個位點甲基化水平。
對于某個區(qū)域的甲基化水平計算方法,不同的方法會得到不同的結(jié)果。
2)區(qū)域甲基化水平計算方法1-Fraction of methylated cytosines
即:甲基化C占區(qū)域內(nèi)所有覆蓋到的C位點的比例
對于圖片中的a:區(qū)域甲基化水平=10/12;b)甲基化水平=11/12
3)區(qū)域甲基化水平計算方法2-Mean methylation level
即:所有C位點的平均甲基化水平,區(qū)域內(nèi)所有甲基化的C的單個位點甲基化水平之和/區(qū)域內(nèi)所有覆蓋到的C位點的個數(shù)
a)甲基化水平=(2/2+3/3+20/21+4/30+4/25+3/17+3/20+6/7+4/6+5/5)/12
b)甲基化水平=(1/5+1/3+3/12+40/41+29/31+30/32+77/87+45/47+4/12+1/7+2/10)/12
4)區(qū)域甲基化水平計算方法3-Weighted methylation level
即:加權(quán)甲基化水平,區(qū)域內(nèi)所有甲基化C位點總的reads數(shù)/區(qū)域內(nèi)總的覆蓋度
a)甲基化水平=(2+3+20+4+4+3+3+6+4+5)/(2+3+21+30+25+17+20+7+6+5+18+25)
b)甲基化水平=(1+1+3+40+29+30+77+45+4+1+2)/(5+3+12+16+41+31+32+87+47+12+7+10