位置:立项数据库 > 立项详情页
高维数据特征选择的稳定性研究
  • 项目名称:高维数据特征选择的稳定性研究
  • 项目类别:青年科学基金项目
  • 批准号:61202144
  • 申请代码:F020508
  • 项目来源:国家自然科学基金
  • 研究期限:2013-01-01-2015-12-31
  • 项目负责人:杨帆
  • 依托单位:厦门大学
  • 批准年度:2012
中文摘要:

高维特征选择的稳定性是一个重要而又尚未解决的难题。已有的特征选择研究主要关注学习机器的预测准确率和计算效率,以准确率及其相关指标作为评价特征选择结果的依据。然而在高维数据空间中,训练数据集上的微小变化会造成特征选择结果的不稳定和不可靠。本项目以基因表达数据为研究对象,从高维数据空间和基因表达数据的分布特点出发,分析高维数据特征选择不稳定性的可能来源,以改善其稳定性和可靠性。研究内容包括通过分析高维数据分布的特点,建立特征选择的稳定性指标;通过对经典特征选择算法的分析,研究基于目标函数的特征评价准则;考虑到特征之间的关联性,提出基于隐变量模型的特征选择策略;针对数据分布的局部性,设计基于分解的多分类特征选择方法;进一步考虑到类内分布的多样性,提出"聚类-特征选择"的递归式局部特征选择策略。本项目的研究成果将提升高维特征选择的稳定性,并将应用到基因选择、基因调控网络和癌症亚型的发现中。

结论摘要:

英文主题词high dimensional data;feature selection;stability;gene expression data;


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 15
  • 6
  • 0
  • 0
  • 0
相关项目
期刊论文 24 会议论文 5 获奖 2
期刊论文 64 会议论文 19 获奖 4
杨帆的项目