位置:立项数据库 > 立项详情页
多标记数据特征选择及其应用的研究
  • 项目名称:多标记数据特征选择及其应用的研究
  • 项目类别:青年科学基金项目
  • 批准号:61005006
  • 申请代码:F030402
  • 项目来源:国家自然科学基金
  • 研究期限:2011-01-01-2013-12-31
  • 项目负责人:尤鸣宇
  • 负责人职称:副教授
  • 依托单位:同济大学
  • 批准年度:2010
中文摘要:

医学临床等科学领域中多标记数据的快速增长对多标记建模提出了迫切需求。数据中无关、冗余特征损害了模型的泛化能力,因此需对多标记数据进行特征选择。已有的特征选择技术忽略了类标之间互相关联和样本分布不均衡这两个多标记数据的特点。本项目计划从中医临床诊断多证型病例数据分析的典型应用出发,研究新型的多标记特征选择技术一是融入多标记数据中类标之间的关联信息;二是消除样本分布不均衡的影响。新技术将在文本、图像、蛋白质功能标注等标准评测数据集上测试,并以蔡小荪等名老中医临床诊断病例的主症选择为示范性应用。通过特征选择技术提高多标记数据分析的效果、效率和可理解性。

结论摘要:

对照项目计划书,项目组高质量全面完成了拟定的研究内容。项目组在高水平论文发表、国际学术合作交流、人才培养等方面均超过项目申请书的预期成果要求。 研究内容包括三个方面1) 研究了融入类标关联信息的多标记特征选择新技术,包括结合类标关联信息的必要性,结合关联信息的多标记建模,及基于多标记模型的嵌入式特征选择;2) 研究了减轻样本分布不均衡影响的多标记特征选择新技术,包括各类标对特征的偏好,减轻分布不均衡影响的特征选择,及大数据环境下新的特征选择;3) 结合医学临床数据的特点,将本项目所提出的新技术,应用到中医诊断的主症选择上。项目资助下, 在国际会议上报告 13 篇次。在IEEE TCBB, IEEE T. NanoBioscience, PRL,IJGS,中国科学等期刊接受和发表论文21篇,其中发表的论文中SCI收录11篇,接受论文中2篇SCI源刊。 受邀为国外著作撰写2章次。参与组织了国际会议IEEE BIBM2013,连续三年参与组织了中医信息学研讨会,作为客座编辑组织国际刊物一次。项目成果2011年获得国际信息安全竞赛 (CDMC2011)第一名。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 16
  • 13
  • 0
  • 2
  • 0
相关项目
期刊论文 6 会议论文 10
期刊论文 23 会议论文 6 专利 2
期刊论文 22 会议论文 5 获奖 1
期刊论文 19 会议论文 15
尤鸣宇的项目