微生物組學(xué)的研究從最初的單個微生物形態(tài)研究,逐漸深入到微生物的DNA、RNA、蛋白、代謝層面,而這些也衍生出來了一系列的組學(xué)研究技術(shù)。從初始的形態(tài)學(xué)觀測,到DNA層面的擴(kuò)增子,宏基因組技術(shù)研究其微生物組成和功能,進(jìn)而到宏轉(zhuǎn)錄組、宏蛋白組、宏代謝組等宏表型組學(xué)的研究。多樣性和宏基因組指明【who is there】有哪些微生物和【what are they doing】這些微生物有哪些功能?而蛋白代謝層面,則可以解決【what have really happened】的問題,哪些過程是實際產(chǎn)生的,這些與表型又有著什么樣的關(guān)聯(lián)。
而近年來,關(guān)鍵詞“microbiome and metabolome”、“metagenome and metabolome”也是逐漸備受關(guān)注的熱點話題,PubMed搜索發(fā)文量也是逐年上升的趨勢。
那么如何來進(jìn)行微生物和代謝組聯(lián)合分析呢?聯(lián)合分析的圖表又怎么解讀?莫慌,本次小編就為大家?guī)碓敿?xì)介紹。
首先,我們進(jìn)入百邁客云平臺,打開代謝組分析結(jié)題報告,在報告左側(cè)找到聯(lián)合分析模塊,然后選擇與微生物聯(lián)合分析個性化,再在右側(cè)選擇需要參與分析的微生物報告,之后進(jìn)入第二步參數(shù)設(shè)置,示例圖如下:
第二步參數(shù)設(shè)置:整體層面選擇相關(guān)性分析方法、相關(guān)性系數(shù)閾值,相關(guān)性的p值。一般默認(rèn)選擇pearson相關(guān)性算法,相關(guān)性系數(shù)0.8,相關(guān)性p值選擇0.05。分組對應(yīng)關(guān)系:這里指的是微生物和代謝組的樣本對應(yīng)關(guān)系,比如A組樣本既做了微生物也做了代謝組,那么就選擇代謝組的A組和微生物組的A組放到一起,具體示例圖如下:
提交分析:等待分析完成獲得分析報告結(jié)果,一般任務(wù)運行周期1-2h。任務(wù)運行完成后,在聯(lián)合分析結(jié)果處查看分析完成的報告和結(jié)果,示例圖如下:
結(jié)果解讀
微生物和代謝組聯(lián)合分析從兩個層面去進(jìn)行聯(lián)合,整體層面去展示微生物和代謝物之間的整體相關(guān)性,比如普氏分析、代謝物聚類-菌群相關(guān)性分析;從差異層面則基于不同的差異處理組,去進(jìn)一步聯(lián)系表型關(guān)系,看具體的微生物和代謝之間的關(guān)系是否與生物的表型差異相關(guān),這里則主要有差異代謝物和菌群相關(guān)性分析、協(xié)慣量分析、典范對應(yīng)分析、隨機森林分析等,接下來我們就這些分析和大家具體看下怎么解讀和應(yīng)用。

整體分析流程圖
整體層面
1、普氏分析
普氏分析(Procrustes analysis)是一種多元統(tǒng)計學(xué)中的形狀比較分析的方法,即通過分析形狀分布,比較兩組數(shù)據(jù)一致性。普氏分析是基于匹配兩個數(shù)據(jù)集中的對應(yīng)點(坐標(biāo)),通過平移、旋轉(zhuǎn)和縮放其中一個數(shù)據(jù)集中點的坐標(biāo)以匹配另一數(shù)據(jù)集中對應(yīng)點的坐標(biāo),并最小化點坐標(biāo)之間的偏差平方和(表示為M2)。對應(yīng)點坐標(biāo)之間的偏差稱為矢量殘差(vector residuals),越小的矢量殘差代表了兩數(shù)據(jù)集具有更高的一致性。
由于兩組數(shù)據(jù)集的屬性不同,并不適合用來直接比較,可分別對兩個數(shù)據(jù)集降維排序分析,并提取特征軸的坐標(biāo)。本分析選用 PCoA 分別對微生物組(屬水平)和代謝組進(jìn)行降維排序,之后進(jìn)行Procrustes分析,比較微生物組與代謝組之間的相似和變異情況。

普氏分析結(jié)果圖
注:圖中不同顏色代表不同的分組;每個線段代表一個樣本,線段一端實心圓點代表微生物組數(shù)據(jù)樣本點,線段另一端實心三角形代表相同樣本的代謝組數(shù)據(jù)樣本點;連線代表兩排序構(gòu)型的矢量殘差,可評價二者間的變異情況,連線越短,表示兩個數(shù)據(jù)集之間一致性越高。Monte Carlo Label Permutations P 表示由 Monte Carlo 算法模擬生成的 p-value,p

文章案例
圖注:Procrustes分析:第一列圖表包含微生物組數(shù)據(jù)(紅點),第二列包含代謝組數(shù)據(jù)(綠點)。第一行包含盲腸數(shù)據(jù),第二行包含乙狀結(jié)腸數(shù)據(jù)。對盲腸微生物組(A)、盲腸代謝組(B)、乙狀結(jié)腸微生物組(D)和乙狀結(jié)腸代謝組(E)進(jìn)行主成分分析。然后進(jìn)行樣本點間(C和F) Procrustes分析。Procrustes圖上的線越長,表明微生物組和代謝組的對象內(nèi)差異越大。所示的顯著性值是使用Vegan R軟件包中的protest函數(shù)計算的,該函數(shù)進(jìn)行重復(fù)的對稱Procrustes分析以估計顯著性。
引用:McHardy I H, Goudarzi M, Tong M, et al. Integrative analysis of the microbiome and metabolome of the human intestinal mucosal surface reveals exquisite inter-relationships[J]. Microbiome, 2013, 1(1): 1-19.
2、雙向正交偏最小二乘法(O2PLS)
雙向正交偏最小二乘法(Two-way orthogonal partial least squares,O2PLS)通過對兩個數(shù)據(jù)組間的整合分析,評估兩個數(shù)據(jù)集之間的內(nèi)在相關(guān)性。兩組數(shù)據(jù)是否可建立O2PLS模型,可判斷數(shù)據(jù)組間是否存在關(guān)聯(lián)性。O2PLS模型一方面可反映不同數(shù)據(jù)組間的整體影響,另一方面可直接體現(xiàn)不同變量在模型中的權(quán)重(權(quán)重越大,意味著該變量的變化對另一個組學(xué)的擾動更劇烈),從而更加精準(zhǔn)地發(fā)現(xiàn)關(guān)鍵調(diào)節(jié)現(xiàn)象。O2PLS 為非監(jiān)督建模,可客觀描述兩數(shù)據(jù)組間是否存在關(guān)聯(lián)趨勢,盡可能從源頭上避免假陽性關(guān)聯(lián)。該方法先對菌落和代謝的數(shù)據(jù)進(jìn)行UV scaling預(yù)處理,再構(gòu)建群落和代謝O2PLS模型,計算每個樣本的得分,得到聯(lián)合得分圖;然后計算每種微生物和代謝物的載荷值,得到載荷圖。聯(lián)合得分圖指示了兩個數(shù)據(jù)矩陣之間的關(guān)系,具有高載荷值的代謝物/微生物被認(rèn)為是兩個數(shù)據(jù)集相似性所必需的。最后選擇前兩個維度載荷值長度 top15 代謝物/微生物繪制柱狀圖。

O2PLS 聯(lián)合樣本得分圖(左)、O2PLS 模型微生物和代謝物的載荷圖(中)、O2PLS 關(guān)聯(lián)程度大的微生物/代謝物柱狀圖(右)
左圖注:圖中點的形狀(圓點和三角形)代表不同分組的樣本,點的顏色代表不同的組學(xué)樣本,紅色代表微生物組樣本,藍(lán)色表示代謝物樣本,圖中橫縱坐標(biāo)表示代謝組和微生物組聯(lián)合的得分。
中圖注:圖中點的顏色代表不同組學(xué)數(shù)據(jù),紅色代表微生物,藍(lán)色代表代謝物。橫縱坐標(biāo)表示聯(lián)合載荷值。載荷值長度 top15 代謝物/微生物表示為Top,用實心三角形表示,其它的代謝物/微生物表示為Others,用實心圓點表示。
右圖注:圖中展示了載荷值長度 top10 的代謝物和載荷值長度 top15 的微生物,紅色柱子代表微生物,藍(lán)色柱子代表代謝物。橫坐標(biāo)表示聯(lián)合載荷軸 1,縱坐標(biāo)表示代謝物/微生物。
3、代謝物聚類-微生物相關(guān)性分析
相關(guān)性分析(correlation analysis)是指對兩個或多個具備相關(guān)性的變量元素進(jìn)行分析,從而衡量兩個變量因素的相關(guān)密切程度。基于皮爾遜相關(guān)系數(shù),可以度量環(huán)境樣本中物種多樣性與代謝物之間的關(guān)聯(lián)程度。從整體水平對代謝物和菌群進(jìn)行相關(guān)性分析,相關(guān)性分析結(jié)果以熱圖,和弦圖,網(wǎng)絡(luò)圖三種形式展現(xiàn)。
(1)代謝物簇-微生物相關(guān)性熱圖:一種代謝物簇/微生物可能與多種微生物/代謝物簇具有相關(guān)性,保留至少含一組相關(guān)性的pvalue 滿足 CCP<0.05 的數(shù)據(jù),然后進(jìn)行熱圖的繪制。熱圖可以通過顏色梯度來反應(yīng)各種代謝物與各個微生物分類之間的相關(guān)性大小,并且可以對多樣性和代謝物進(jìn)行聚類分析。

代謝物簇-微生物相關(guān)性熱圖
注:圖右側(cè)為微生物(門水平),下方為代謝物簇,左側(cè)和上方分別為微生物和代謝物簇的聚類樹狀圖。不同顏色代表皮爾遜相關(guān)系數(shù)的大小,絕對值越接近于 1,相關(guān)性越高。紅色表示正相關(guān),而綠色表示負(fù)相關(guān)。星號表示代謝物簇和微生物之間顯著性相關(guān)(p<0.05),*、**和***表示相關(guān)性顯著程度依次增強,分別表示 p<0.05,p<0.01和 p<0.001.
(2)代謝物簇-微生物和弦圖:將top30 頻數(shù)的代謝物簇/微生物的相關(guān)性結(jié)果表,保留至少含一組相關(guān)性系數(shù)絕對值在Top 30(按照相關(guān)系數(shù)絕對值從大到小排序)內(nèi)的數(shù)據(jù) ,用于相關(guān)性弦圖的繪制。

代謝物簇-微生物相關(guān)性和弦圖
注:弦圖有兩種形式:文件名含label的和弦圖,代謝物簇/微生物名稱在圈外展示;文件名含legend的和弦圖,代謝簇在左下角展示,微生物在右下角展示。弦圖左半圈為代謝物,右半圈為微生物,每一條弦表示該代謝物與該微生物具有顯著相關(guān)性,紅色弦代表正相關(guān),綠色弦代表負(fù)相關(guān)。弦的寬度越寬,表示與這個代謝物或微生物相關(guān)的頻數(shù) count 越多。
(3)代謝物簇-微生物網(wǎng)絡(luò)圖:利用代謝物簇-微生物和弦圖的相關(guān)性系數(shù)表,用于相關(guān)性網(wǎng)絡(luò)圖的繪制。

代謝物簇-微生物相關(guān)性網(wǎng)絡(luò)圖
注: 圖中代謝物簇用藍(lán)色方形標(biāo)出,微生物用紅色圓形標(biāo)出。實線代表正相關(guān),虛線代表負(fù)相關(guān)。

文章案例:結(jié)腸微生物組和血清代謝組之間的聯(lián)系
熱圖顯示了ND組和3xtg組的代謝物概況和特定細(xì)菌家族和屬的相對豐度之間的關(guān)聯(lián)。紅到藍(lán)的比例:從正到負(fù)的關(guān)聯(lián)。Pearson’s correlations與數(shù)據(jù)分布一致,經(jīng)Shapiro-Wilk測試驗證。*p < 0.05.
引用:Sanguinetti E, Collado M C, Marrachelli V G, et al. Microbiome-metabolome signatures in mice genetically prone to develop dementia, fed a normal or fatty diet[J]. Scientific Reports, 2018, 8(1): 1-13.

相似性分析和spearman相關(guān)分析結(jié)果的說明
(A) Procrustes analysis (PA):連接兩點的線的長度表示兩個數(shù)據(jù)集之間樣本的一致性。(B) O2PLS模型:O2PLS模型中具有較大的荷載值,被認(rèn)為是它們相似性的重要因素。(C) 微生物和代謝物之間的spearman相關(guān)性的Circos圖。(D) 不同的代謝物和屬于韌皮部的微生物之間的spearman相關(guān)網(wǎng)絡(luò)。
引用:Ni Y, Yu G, Chen H, et al. M2IA: a web server for microbiome and metabolome integrative analysis[J]. Bioinformatics, 2020, 36(11): 3493-3498.
差異層面
1、差異代謝物-菌群相關(guān)性分析
基于差異代謝物和差異菌群(genus 屬水平)進(jìn)行相關(guān)性分析,不對差異代謝物進(jìn)行降維處理,其他分析原理同整體層面的代謝物聚類-微生物相關(guān)性分析。也是以相關(guān)性熱圖,和弦圖,網(wǎng)絡(luò)圖三種形式展現(xiàn)。

差異代謝物-差異菌群相關(guān)性熱圖(左)、差異代謝物-差異菌群相關(guān)性和弦圖(右上)、差異代謝物-差異菌群相關(guān)性網(wǎng)絡(luò)圖(右下)
2、協(xié)慣量分析
協(xié)慣量分析(coinertia analysis)可用于兩組變量的分析,常見于生態(tài)學(xué)中研究植被與環(huán)境的關(guān)系,隨后被運用到多組學(xué)聯(lián)合分析中。選擇差異微生物(屬水平),并將微生物將按照門劃分類,結(jié)合差異代謝物可展現(xiàn)出差異代謝物和微生物(屬水平)之間的關(guān)系,也能體現(xiàn)微生物不同類群間的分布情況,一般情況下同類群的微生物分布相對集中,不同的差異分組中的同類微生物分布可能不同。
3、典范對應(yīng)分析
典范對應(yīng)分析(canonical correspondence analysis, CCA),是基于對應(yīng)分析發(fā)展而來的一種排序方法,將對應(yīng)分析與多元回歸分析相結(jié)合,每一步計算均與環(huán)境因子進(jìn)行回歸,又稱多元直接梯度分析。將差異代謝物視為環(huán)境因子,與差異菌群(屬水平)進(jìn)行典型對應(yīng)分析能揭示菌群的分布特點的同時也能挖掘與之相關(guān)聯(lián)的代謝物。

協(xié)慣量分析結(jié)果圖(左)、典范對應(yīng)分析分析結(jié)果圖(右)
左圖注:圖中一個圓代表一個微生物,不同的顏色表示不同的分類(按門劃分,按照門名稱排序,前15個門顯示對應(yīng)門名稱,其他門通稱為*_other),三角形是代謝物;微生物、代謝物與原點連線形成的夾角反映了代謝物和微生物之間的相關(guān)性,銳角為正相關(guān),鈍角為負(fù)相關(guān),直角為不相關(guān)。
右圖注:圖中的點表示微生物,箭頭為代謝物(為了更清晰的展示代謝物,根據(jù)圖幅,統(tǒng)一將箭頭的長度進(jìn)行了一定比例的縮放),僅展示箭頭長度top5 的代謝物名稱。微生物和原點連線與箭頭形成的夾角反映了代謝物和微生物之間的相關(guān)性,銳角為正相關(guān),鈍角為負(fù)相關(guān),直角為不相關(guān)。

文章案例:瘤胃微生物和代謝物的相關(guān)性分析
(A) 差異代謝物和OTU之間的相關(guān)性分析。(B) 差異代謝物和微生物之間的限制性對應(yīng)分析。(C) 差異代謝物和微生物區(qū)系之間的相關(guān)熱圖。*P < 0.05; **P < 0.01; ***P < 0.001.
引用:Liu X, Sha Y, Lv W, et al. Multi-omics reveals that the rumen transcriptome, microbiome and its metabolome co-regulate cold season adaptability of Tibetan sheep[J]. Frontiers in microbiology, 2022: 887.
4、隨機森林分析
在機器學(xué)習(xí)中,隨機森林(Random Forest)是一個含多個決策樹的分類器,并且其輸出的類別是由個別樹輸出的類別的眾數(shù)而定。在隨機森林中,集成模型中的每棵樹構(gòu)建時的樣本都是由訓(xùn)練集經(jīng)過有放回抽樣得來的。隨機森林構(gòu)建過程的隨機性能夠產(chǎn)生具有不同預(yù)測錯誤的決策樹。通過取這些決策樹的平均,能夠消除部分錯誤。隨機森林建??梢栽诜诸悤r評估特征的重要性。隨機森林建模被廣泛應(yīng)用于少樣本、高特征維度的數(shù)據(jù)集建模中。在多組學(xué)聯(lián)合分析中,可以通過對模型特征的排序篩選出對模型重要的特征,從而起到篩選biomarker的目的。還可以通過不同組學(xué)的單獨建模與合并數(shù)據(jù)建模的ROC曲線(受試者回歸曲線,Receiver Operating Characteristic curve)對比,評估哪種組學(xué)能更好地分離對照組和實驗組。

隨機森林分類器特征重要性排序箱線圖(左)、隨機森林分類器ROC曲線圖(右)
左圖注:將兩組數(shù)據(jù)合并建模并按模型特征重要性從大到小排序,圖片顯示top 20的特征,依據(jù)K重交叉驗證結(jié)果作箱線圖。

文章案例:使用隨機森林模型評估預(yù)測IHH暴露能力的ROC曲線
右圖注:虛線顯示訓(xùn)練集K重交叉驗證的平均ROC曲線,實線顯示獨立驗證的ROC曲線。不同顏色虛線和實線分別表示代謝組、微生物組(屬水平)分別建模以及合并建模的ROC曲線。
綠色曲線代表每個小鼠模型內(nèi)的分類準(zhǔn)確性。紫色ROC曲線對應(yīng)于使用來自ApoE-/-小鼠模型的腸道微生物組(a)和代謝組(b)數(shù)據(jù)訓(xùn)練的模型,以預(yù)測Ldlr-/-小鼠的IHH暴露。紅色曲線顯示的是在ApoE-/-小鼠上測試的Ldlr-/-小鼠的微生物組(c)和代謝組(d)數(shù)據(jù)。IHH:間歇性低氧和高碳酸血癥。
引用:Tripathi A, Xu Z Z, Xue J, et al. Intermittent hypoxia and hypercapnia reproducibly change the gut microbiome and metabolome across rodent model systems[J]. MSystems, 2019, 4(2): e00058-19.