位置:立项数据库 > 立项详情页
归纳学习中的不确定性研究
  • 项目名称:归纳学习中的不确定性研究
  • 项目类别:面上项目
  • 批准号:61170040
  • 申请代码:F020107
  • 项目来源:国家自然科学基金
  • 研究期限:2012-01-01-2015-12-31
  • 项目负责人:王熙照
  • 负责人职称:教授
  • 依托单位:河北大学
  • 批准年度:2011
中文摘要:

不确定性是近十多年来在许多领域倍受关注的一个研究课题。本项目拟对归纳学习中的不确定性开展一个系统的研究。重点研究不确定性在归纳学习过程中的量化表示及可调整性和不确定性的极值化(极大化或极小化)对归纳学习过程的影响,包括(1)极小不确定性原则的建立以及此原则下的决策树归纳;(2)极大化模糊上积分对模糊分类器融合系统性能的改善;(3)极大不确定性原则的建立以及基于此原则归纳学习系统不确定性与系统泛化能力间关系的研究;(4)极大不确定性原则下主动学习的样例选取机制研究和对分类器性能的改善;(5)不确定性极值化的相关最优化模型及求解算法研究。归纳学习中不确定性的系统研究可丰富不确定性理论、扩大不确定性理论的应用范围,它对建立基于不确定性减少的知识发现模式有着指导意义,在复杂环境下的智能控制、可靠性分析、决策支持等领域,尤其在医疗图像处理中有着广泛的应用前景。

结论摘要:

不确定性作为影响学习系统的一个关键因素,对构建新的学习机制、改善学习系统的自适应能力、以及提高学习系统的整体性能有着不可忽视的作用。本项目首次系统研究了不确定性在不同归纳学习过程中的量化表示及调整,不确定性极值对于归纳学习过程的影响,不确定性与学习系统的泛化能力之间的关系等。主要研究内容和重要结果包括 1. 在决策树归纳学习中,对不确定性给出新的量化表示,如一般广义熵函数、结合信息熵和不可指定性的不确定性度量。证实了基于“极小化不确定性原则”构建连续值属性决策树,能够显著降低决策树归纳的计算复杂性,并能有效地提高学习系统的泛化能力。 2. 在基于模糊积分的归纳学习中,提出用模糊上积分来表示分类器在交互作用中的不确定性。通过极大化这种不确定性建立的模糊上积分线性优化模型改善了模糊分类器融合系统的分类性能;提出的基于模糊积分的极限学习机 (ELM)集成考虑了融合分类器之间的交互作用,基本上消除了ELM算法的不稳定性和过拟合等问题。 3. 在主动学习过程中,提出了基于最大化不可指定性样例选取的归纳学习方法。其核心思想是在选择训练样例时,使得模糊决策树的调整量最小。理论和实验上均表明了基于这种选择机制归纳出的模糊决策树的泛化能力优于基于随机选择机制归纳出的模糊决策树。 4. 在集成学习的框架下,我们研究了模糊不确定性和基分类器的泛化能力之间关系,讨论了模糊性对分类边界的影响,验证了条件最大熵原则,得出结论在分类精度给定的情况下,模糊基分类器的不确定性越大,泛化能力越强。这对于复杂分类边界问题构建高性能分类器具有指导意义。 5. 在不确定性与泛化能力的应用研究中,提出了一种基于模糊积分的不完全小波包子空间集成人脸识别方法。模糊积分表示了基分类器交互中的不确定性,同时充分利用各个小波子空间的识别信息,有效提高了人脸识别的准确率。以上是本项目通过研究了不确定性的量化表示对归纳学习系统性能影响得到的主要结果。项目研究迄今出版专著2部,完成学习系统一个,发表学术论文50多篇。其中,SCI检索30篇。JCR一区TOP论文1篇,JCR二区论文10篇,高被引用论文3篇。这些研究成果丰富了不确定性理论和应用,对于复杂环境下的智能控制、高性能复杂分类系统的构建、大数据决策支持系统等领域有着广泛的应用。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 77
  • 17
  • 0
  • 0
  • 2
期刊论文
相关项目
期刊论文 21 会议论文 9 著作 1
王熙照的项目
期刊论文 47 会议论文 20 著作 1