本项目对可以有效处理高维、类别分布不平衡、代价不同、类别未标记、有结构数据的机器学习方法进行研究,完成了原定研究计划并取得以下主要成果: 1)提出了多种非线性降维和特征选择新方法;2)提出了基于集成的探索式下取样等多种类别不平衡学习新方法;3)提出了多类代价敏感学习等新方法;4)提出了能有效利用类别未标记数据的多种主动、半监督学习新方法;5)提出了能有效利用样本内蕴结构信息的多种新方法;6)研制两个原型系统。本项目共发表(录用)论文123 篇,其中国际期刊论文34 篇(包括一流国际期刊AIJ、JAIR、ACM/IEEE Trans.等27篇)、国际会议论文69篇(包括一流国际会议ICML、NIPS、KDD、IJCAI等41篇),获国家发明专利4项(另有11项申请在审)、软件著作权1项、国际会议论文奖2项、全国性会议论文奖3项、中国计算机学会优博3篇,做国际会议特邀大会报告11次。论文被SCI、EI、ISTP检索143篇次,已被他引600余次。主持国际期刊专辑4期、国内3期,主编国际文集/论文集8部、国内2部。在境内组织国际会议2次、境外4次,组织国内会议4次。培养青年人才若干名。
英文主题词machine learning, data mining