鉴于生物圈中微生物资源的巨大开发潜力以及测序技术不断发展,宏基因组学研究的不断深入,微生物群落已经被看作一个整体来进行分析并且已经得到广泛应用。然而由于微生物的多样性以及微生物菌群的复杂性,使得精确确定和定量宏基因组数据中的分类单元成为宏基因组数据分析的难点。已有的宏基因组数据标记分析工具无法解决微生物群落预测结果重现的稳健性、准确性以及处理非冗余标记物方面遇到的问题。笔者提出了一个新的基于宏基因组自助抽样(metagenomic bootstrap)的生物标志物选择方法,它结合了mRMR(minimal redundancy maximal relevance)和自助抽样方法(bootstrapping),可以更加稳健、准确而有效地通过对宏基因组数据的挖掘实现非冗余标记物的筛选。基于模拟数据集,通过其与2种自上而下的方法(Metastats、LEf Se)以及自下而上的方法(Wilcoxon秩和检验)进行对比,表明本方法可以在较高准确率的基础上更加稳健地选择更多的非冗余生物标志物。