導讀
研究背景:
人乳頭瘤病毒(HPV)是宮頸癌的主要原因,HPV16和18是全球兩種流行的高危HPV類型。宮頸癌是女性中第二大常見的惡性腫瘤。每年有570,000名女性被診斷出患有宮頸癌,并且有311,000名女性死于這種疾病。盡管已知持續(xù)的HPV感染會導致宮頸癌,但目前尚不清楚HPV如何誘發(fā)癌變,以及在該過程中到底發(fā)揮什么重要的功能。HPV感染后,HPV蛋白E6和E7被表達,其抑制腫瘤蛋白p53和視網(wǎng)膜母細胞瘤蛋白,破壞細胞增殖和許多其他生物學過程,并誘發(fā)宮頸癌。此外,HPV DNA也可能整合到人類DNA中,這是致癌過程中的早期重要事件。另外,癌癥的進展可以通過病毒DNA整合入抑癌基因來解釋。這種整合入宿主DNA會使那些基因失活,從而導致生長不受控制。了解病毒的致癌作用對于HPV陽性癌癥的臨床治療至關(guān)重要。
結(jié)論:
作者通過Nanopore和Illumina測序?qū)ο惹鞍l(fā)表的樣品的整合位點進行了重新測序。在對結(jié)果進行分析之后,得出了三點結(jié)論:首先,從所有三個數(shù)據(jù)集(即,Nanopore,Illumina和已發(fā)布的數(shù)據(jù))中找到了19個先前發(fā)布的整合位點中的13個,表明這些元素之間具有很高的重疊率和可比性;其次,與先前發(fā)表的論文相比,Nanopore和Illumina數(shù)據(jù)確定了66個獨特的整合位點,其中13個已通過Sanger測序驗證,這表明與公開數(shù)據(jù)相比,作者的結(jié)果對整合位點的檢測靈敏度更高;第三,作者建立了可用于通過納米孔測序數(shù)據(jù)檢測HPV整合位點的pipeline,并且無需進行糾錯分析??偠灾c現(xiàn)有的Illumina數(shù)據(jù)分析pipeline方法相比,測試了一種新的納米孔數(shù)據(jù)分析方法,并證明了該方法在整合位點檢測中是可靠的,所需的測序數(shù)據(jù)更少。它提供了有力的證據(jù)和工具來支持納米孔在病毒狀態(tài)識別中的潛在應(yīng)用。
材料與方法
實驗結(jié)果
一、數(shù)據(jù)質(zhì)控
作者通過對目標區(qū)域捕獲后進行文庫構(gòu)建,分別進行Nanopore和Illumina測序,分別獲得130.2 Mb和1.64 Gb的clean?reads(圖1)。
?圖1
二、通過Nanopore和Illumina數(shù)據(jù)鑒定HPV整合位點
作者構(gòu)建Nanopore分析pipeline(圖2A),通過Blast與人和HPV16病毒基因組進行比對,共識別339個整合位點,通過過濾篩選最終剩余60個位點進行后續(xù)的分析。Illumina測序共獲得1718個整合位點,篩選reads覆蓋度大于3的位點54個進行后續(xù)分析。
?圖2
所有斷點在染色體上的分布見圖3A。染色體chr20、chr2、chr6分別由12、11和8個斷點,chr1和chrX均存在7個斷點,其余染色體斷點分布均在5以下。在每個位點上的reads覆蓋度從2~406不等,大約有31.7%以上的位點覆蓋深度在10以上。在top5的覆蓋深度位點中3個位于chr20(HPV16:2804,chr20:32516985 (406 reads);HPV16:7139,chr20:32478733(169 reads);HPV16:4276,chr20:32502143(51reads)),2個位于chrX(HPV16:5534,chrX:20464412 (132 reads);HPV16:3163,chrX: 20462930 (50 reads))。
圖3B展示了60個位點在HPV基因組上的分布,L2基因中有18個,L1中有12個,E1中有11個,E2中有7個,其他每個基因(E6,LCR,E5和E7)上小于4個。
在人基因組上,有38個位點在基因間區(qū),18個位于內(nèi)含子區(qū)域,2個位于非編碼區(qū)域,1個位于外顯子區(qū)域,1個位于downstream區(qū)域。
進一步分析人基因組上的位點分布,在chr20染色體上的12個位點中,有10個在基因CHMP4B和RALY-AS1之間,有一個位于KIF3B和ASXL1之間,最后一個位于基因ATRN的內(nèi)含子區(qū)域。除了chr20染色體外,其他染色體上也有明顯的位點聚集趨勢,例如,chrX染色體上的6個位點在基因RPS6KA3和CNKSR2之間,chr6染色體上的3個位點位于基因CAGE1的內(nèi)含子或者downstream區(qū)域。
圖3
三、在不同數(shù)據(jù)集中的位點差異
在Illumina測序獲得的54個整合位點中,有19個與之前報道的相符。整合所有位點并做韋恩圖(圖4),有13個位點是3種數(shù)據(jù)(Nanopore、Illumina、published)都存在的,這表明不同平臺間重復性很好。共有18個位點同時出現(xiàn)在Nanopore和Illumina中,三個位點同時出現(xiàn)在納米孔測序和以前發(fā)表的論文中,只有一個位點在Illumina和已發(fā)表的論文重疊。在兩個平臺中確定的整合位點中,一些斷點具有高度豐富的reads數(shù),例如HPV16:2804,chr20:32516985,Nanopore結(jié)果中有406個reads,Illumina結(jié)果中有1439個reads。其他斷點的reads數(shù)很少,例如HPV16:4250,chr21:97550764,其中Nanopore結(jié)果中有兩個reads,而Illumina結(jié)果中只有四個reads。
除了重疊的位點外,每個平臺都有自己獨特的整合位點。 Nanopore、Illumina和文獻中,分別擁有26、22和2個唯一的整合位點。在Nanopore識別的26個位點中,其中6個reads支持度在6以上。因此,在Illumina,Nanopore和文獻這三種方法確定的整合位點中,Nanopore具有相對可靠的豐度,可以確定準確的整合位點。
?圖4
作者為了測試數(shù)據(jù)確定的新整合位點的準確性,利用Sanger測序進行驗證??偣策x擇了14個整合位點進行驗證,并對13個進行PCR擴增并成功測序,表明這些整合位點的真正陽性,這些陽性位點大多由Nanopore和Illumina平臺鑒定。
圖5
四、受影響的基因功能分析
合并3種不同平臺的整合位點,并對整合完的83個位點進行注釋,并進行了進一步的功能分類和途徑分析。這些基因分為八個生物學過程,包括RNA聚合酶II啟動子的轉(zhuǎn)錄正調(diào)控(6個基因),RNA聚合酶II啟動子的轉(zhuǎn)錄負調(diào)控(6個基因),RNA聚合酶II啟動子的轉(zhuǎn)錄調(diào)控(5個基因), RNA聚合酶II啟動子的轉(zhuǎn)錄(4個基因),視黃酸受體信號傳導途徑的負調(diào)控(2個基因),皮膚屏障的建立(2個基因),近端/遠端模式形成(2個基因)和胚胎肢體形態(tài)發(fā)生(2個基因)六個胞質(zhì)(13個基因),核質(zhì)(8個基因),胞外外泌體(8個基因),蛋白質(zhì)結(jié)合(6個基因),DNA結(jié)合(2個基因)和肌動蛋白結(jié)合(2個基因)。
討論
數(shù)據(jù)表明,大多數(shù)整合位點存在于人類基因組的基因間區(qū)域中,與先前的研究一致。由于鑒定出人類基因組中有很大一部分(60%)的基因間區(qū)域,研究結(jié)果確定了約40%的整合位點位于人類基因組的基因間區(qū)域中,沒有顯著差異。因此,可以得出結(jié)論,整合位點在人類基因組中的分布方式受到基因組功能結(jié)構(gòu)性質(zhì)的影響。另外作者還發(fā)現(xiàn)整合發(fā)生在非編碼RNA中,它起著許多重要的功能,例如lncRNA與p53蛋白相互作用。插入ncRNA可能會導致更嚴重的功能中斷。其中HPV有插入的傾向,例如腫瘤蛋白63(TP63),它在致癌作用中起著非常重要的作用。
在這項研究中,作者確定了兩個基因CHMP4B和RALY-AS1。整合簇的趨勢非常強,在76個獨特的整合位點以及其他幾個染色體區(qū)域中有10個整合位點。為什么病毒會整合到幾個特定區(qū)域,并且是隨機的還是特定的?需要進一步的研究來回答這些問題。