位置:立项数据库 > 立项详情页
多标记数据分类及其特征选择算法研究
  • 项目名称:多标记数据分类及其特征选择算法研究
  • 项目类别:青年科学基金项目
  • 批准号:61100119
  • 申请代码:F020512
  • 项目来源:国家自然科学基金
  • 研究期限:2012-01-01-2014-12-31
  • 项目负责人:刘华文
  • 依托单位:浙江师范大学
  • 批准年度:2011
中文摘要:

多标记数据在现实情况中普遍存在。目前多标记数据分类处理及其相关技术尚未成熟,对于影响其效率和性能的因素等的认识还不够深入。针对当前多标记数据分类(MLC)和特征选择技术存在的问题,本项目以多标记数据为研究对象,从多标记数据的特点入手,重点研究MLC问题及其特征选择算法,通过采用壳邻居/互邻居、关联挖掘、LSI语义处理、特征选择和机器学习等技术,挖掘多标记数据之间、类别标记之间及特征之间的相互关联和依赖关系,探讨它们与MLC之间的关系,明确其对MLC算法性能的影响程度,项目预期将揭示MLC分类技术特点,实现建立高效率、高性能MLC模型的目标,提出适用于不同实际问题的MLC方法。项目的研究成果对于完善多标记数据学习、特征选择、数据挖掘技术的理论研究具有重要意义,可以为多标记数据的实际应用提供切实可行的解决方案,为决策的制定、智能信息处理等提供科学依据。

结论摘要:

多标记数据学习是机器学习的研究热点之一。如何有效地处理多标记数据的高维性,构建高效、鲁棒、强泛化能力的多标记学习算法是多标记学习的瓶颈和难点。本项目以大规模高维的多标记数据为研究对象,针对已有研究中存在的多标记数据学习方法和及其特征选择等问题,研究特征选择在多标记学习领域中的关键技术,利用多标记数据中类别标记与特征之间的相互关联关系,探讨多标记数据分类学习的特点,提出适用于不同实际问题的多标记数据分类学习方法,实现建立高效率、高性能分类模型的目标,为多标记学习理论及其应用夯实基础。本项目研究取得了一定的学术成果,如发表或录用了15篇学术论文(其中9篇被SCI检索),并(协助)培养了8名研究生,申请到了3项与课题相关的基金资助。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 16
  • 5
  • 0
  • 0
  • 0
相关项目
期刊论文 30 会议论文 4 获奖 2
期刊论文 27 会议论文 6 获奖 2 专利 4
期刊论文 15 会议论文 6
刘华文的项目