Binning指將宏基因組測(cè)序得到的混合了不同微生物的序列reads或序列組裝得到的contigs或scaffolds按物種分開歸類的過程。這些分開歸類的序列被稱為宏基因組組裝基因組(metagenome-assembled genomes,MAGs)。
宏基因組測(cè)的是一個(gè)環(huán)境中的全部微生物的基因組信息,以獲得群落中全部的物種信息和功能信息,而Binning可以把宏基因組數(shù)據(jù)中來(lái)自同一菌株的序列聚到一起,得到一個(gè)菌株的基因組,對(duì)不同的菌株進(jìn)行分類鑒定。Binning分析使我們得以洞察這些無(wú)法在實(shí)驗(yàn)室培養(yǎng)獲得的菌株的生態(tài)適應(yīng)機(jī)制、營(yíng)養(yǎng)互作機(jī)制和新陳代謝功能等,可以研究在環(huán)境中起重要作用的微生物、進(jìn)化機(jī)制、及其與宿主的互作機(jī)制等。
與常用數(shù)據(jù)庫(kù)(NR、KEGG、eggNOG、CAZy、CARD)進(jìn)行比對(duì),獲得基因功能信息并對(duì)各數(shù)據(jù)庫(kù)注釋情況進(jìn)行統(tǒng)計(jì)。
對(duì)高質(zhì)量Bin去冗余后得到的結(jié)果進(jìn)行de novo基因預(yù)測(cè),分別得到編碼基因、重復(fù)序列、tRNA及rRNA基因信息。
根據(jù)基于聚類的序列類型的不同,可分為reads binning, contig binning和 genes binning。