实际应用中广泛存在着混合数据描述的分类和回归任务,申请人对此进行了系统研究。提出了基于邻域粒化和粗糙近似的分类模型,设计了基于此模型的边界样本搜索、特征选择和规则提取算法;提出了基于核函数粒化和模糊近似的核模糊粗糙集模型,分析了其鲁棒性,设计了鲁棒的模型、开发了基于鲁棒模型的加权采样、属性约简和模糊分类算法;系统拓展了信息熵模型,提出了邻域熵和模糊信息熵的概念,设计了基于熵模型的混合数据属性约简方法;提出了模糊优势关系粗糙集和排序熵模型,得到了鲁棒的单调分类方法。这些工作系统提升了粒计算的实用性。已发表SCI论文51篇,SCI二区论文22篇,SCI他引258次。本项目基于申请人现有成果,面向太阳活动预报应用需求,研究多模态复杂数据的分类方法,探索基于混合距离学习、多核表示和多模态字典表达的分类建模方法,集成和拓展了机器学习与模式识别最前沿的成果,有望形成多模态数据知识发现的基本框架。
英文主题词multi-modal data;knowledge discovery;uncertainty modeling;classification learning;feature selection