高通量的"组学"(-omics)数据中蕴含着与疾病相关的生物标记物,为深入研究疾病的发生发展机制带来了前所未有的机遇。但是,如何从高维高通量的组学数据中发现生物标记物是生物数据分析的重点和难点。本项目针对目前生物标记物筛选中通用的过滤式(如方差分析、秩和检验等)和封装式(如LASSO,支持向量机等)等方法的局限和不足,提出了一个在贝叶斯变量选择框架下通过集成数据内部结构信息来筛选生物标记物的策略;重点探讨并建立从基因水平结合当前数据所蕴含的特定结构信息(如基因间的关联网络)来筛选生物标记物的平台,以进一步阐明这种"融合"式的筛选策略对生物标记物发现的影响及价值。本项目的成功实施,将对转化医学和分子生物学提供重要的方法论和计算工具,为"个性化医疗"的研发和实施产生明显的促进作用。
英文主题词Biomarker;Bayesian Statistics;Variable Selection;Omics Data;Strategies