基于单个评价标准的机器学习研究已经得到长足发展,但是很多机器学习问题本质上是多目标优化问题。进化算法解决多目标优化问题具有潜在的优势并取得了巨大的成功。本课题利用进化多目标优化方法解决具有多目标特性的机器学习问题,探索多个评价标准对机器学习的影响。本课题以无监督的机器学习方法为例,深入研究目标函数对机器学习的影响机理和模型选择机制,分析总结进化多目标机器学习算法设计的一般规律和指导原则。主要研究内容包括高效的进化多目标优化算法研究;进化多目标聚类研究;基于多目标框架的复杂网络中社区发现与演化研究;进化多目标机器学习算法在电信数据挖掘领域的应用研究。本课题将机器学习和进化多目标优化这两个研究领域结合起来,以进化多目标优化的视角研究机器学习问题。本课题的研究能够加深机器学习的机理和方法的理解,同时促进进化多目标优化的研究和发展。
Machine learning;Multi-objective optimization;Unsupervised learning;Multi-label learning;Community dection
作为人工智能的核心研究领域,机器学习已经成为智能数据分析的基本方法。基于单个评价标准的机器学习研究已经得到长足发展,但是很多机器学习问题本质上是多目标优化问题。进化算法解决多目标优化问题具有潜在的优势并取得了巨大的成功。本课题利用进化多目标优化方法解决具有多目标特性的机器学习问题,探索多个评价标准对机器学习的影响。本课题深入研究目标函数对机器学习的影响机理和模型选择机制,分析总结进化多目标机器学习算法设计的一般规律和指导原则。主要研究内容包括高效的进化多目标优化算法研究;进化多目标聚类和分类算法研究;基于多目标框架的复杂网络中社团发现与演化研究;进化多目标机器学习算法在电信数据挖掘领域的应用研究。本课题的主要研究成果如下(1) 完善占优树理论,提出了高效的基于占优树的多目标进化算法,分析了占优树的时间复杂度和动态变化规律,并将其应用于多关键字检索;(2)深入研究了多目标聚类和社团发现问题,提出了多目标社团发现算法和模型选择方法,系统分析了复杂网络中的不同的目标函数对社团划分效果的影响;(3)将多目标优化应用于多标签分类问题,提出了多标签集成学习算法和多目标多标签学习算法,深入分析了多目标优化对分类性能的影响;(4)研究了异质信息网络中的相似性度量和聚类问题,提出了HeteSim标准用于度量异质信息网络中任意两个节点的相关性,并应用于语义推荐系统。总体来说,本项目按照计划执行。在本项目的资助下,发表主要相关论文22篇,其中CCF B类以上高水平论文11篇,SCI 检索论文7篇,EI检索论文15篇,ISTP检索论文1篇, 1篇最佳会议论文奖。培养了硕士生4名,博士生1名。