Binning指將宏基因組測序得到的混合了不同微生物的序列reads或序列組裝得到的contigs或scaffolds按物種分開歸類的過程。這些分開歸類的序列被稱為宏基因組組裝基因組(metagenome-assembled genomes,MAGs)。
宏基因組測的是一個環(huán)境中的全部微生物的基因組信息,以獲得群落中全部的物種信息和功能信息,而Binning可以把宏基因組數(shù)據(jù)中來自同一菌株的序列聚到一起,得到一個菌株的基因組,對不同的菌株進行分類鑒定。Binning分析使我們得以洞察這些無法在實驗室培養(yǎng)獲得的菌株的生態(tài)適應機制、營養(yǎng)互作機制和新陳代謝功能等,可以研究在環(huán)境中起重要作用的微生物、進化機制、及其與宿主的互作機制等。
與常用數(shù)據(jù)庫(NR、KEGG、eggNOG、CAZy、CARD)進行比對,獲得基因功能信息并對各數(shù)據(jù)庫注釋情況進行統(tǒng)計。
對高質(zhì)量Bin去冗余后得到的結果進行de novo基因預測,分別得到編碼基因、重復序列、tRNA及rRNA基因信息。
根據(jù)基于聚類的序列類型的不同,可分為reads binning, contig binning和 genes binning。