由代谢组动态指纹谱,可以研究机图体在外界刺激或基因表达改变的影响下随时间变化的代谢模式特征,辨识和解析被研究对象的生理和病理状态。对于代谢组数据的分析,主要问题是相对于给定的样品数目谱峰的数量巨大,同时代谢组分浓度含量极微,变动范围可宽达7~9个数量级,其数据具有非常复杂的特性。本研究主要针对的是,代谢组动态指纹图谱数据的预处理、变量选择、因果关系网络、综合特征提取及结果可视化几方面的问题。具体内容包括用小波分析方法实现代谢组数据的分解与重构、谱峰识别、重叠信号解析、基线漂移校正、弱信号检出;用于特征选择的动态随机森林模型(RF)的构造及算法;探讨揭示代谢组分受特征因子调控和具有因果关系的动态贝叶斯网络模型(DBN);评价独立成分分析(ICA)和自组织特征映射(SOM)对特征变量降维及可视化效果;研制新算法的统计软件。本研究将为代谢组数据分析提供更为有效的统计模型及数据分析方法。