随着计算机和数据库技术的发展,很多研究领域需要处理的数据维度越来越高,特征选择被广泛应用于剔除高维数据中的无关/冗余特征,并提高高维数据分析的准确性。对于高维数据特征子集空间的搜索问题,大多数传统搜索方法都无法在短时间内给出令人满意的结果。本项目在国内外首次提出一种新型自生式Memetic特征选择框架动态自适应地对特征子集最小化和机器学习性能最大化进行多目标优化。通过混合基于封装方法的生物启发式全局搜索和基于过滤方法的局部搜索,新框架充分结合封装方法的准确性和过滤方法的快速性,有效提高特征子集空间的搜索效率,在一定程度上解决高维数据的特征选择问题。该项目的实现将为高维数据特征选择提供一个通用框架,可以灵活组合不同的生物启发式算法、过滤特征选择方法和机器学习方法。新框架对于面临高维数据挑战的许多前沿研究领域有较高的应用价值,理论研究上属于国际源头创新,为解决相关问题提供全新选
Memetic Algorithm;Feature Selection;Evolutionary Computation;Computational Intelligence;Machine Learning
随着计算机和数据库技术的发展,很多研究领域需要处理的数据维度越来越高,特征选择/提取被广泛应用于识别相关数据特征,剔除高维数据中的无关/冗余特征,提高高维数据处理和分析效率。对于高维数据特征子集空间的搜索问题,大多数传统搜索方法都无法在短时间内给出令人满意的结果。本项目研究基于Memetic计算(模因计算)的特征选择/抽取框架,动态自适应地对特征子集最小化和分析准确率最大化进行优化。通过混合生物启发式全局搜索和元启发式局部搜索,新框架充分结合局部搜索的快速性和全局搜索的稳定性,有效提高特征子集空间的搜索效率。该项目成果为高维数据特征选择/抽取提供通用框架,可以灵活组合不同的生物启发式算法、过滤特征选择方法和数据分析方法。新框架对于面临高维数据挑战的许多前沿研究领域有理论价值和潜在应用前景,能在一定程度上解决高维数据的特征选择/抽取问题。项目按照计划进度正常执行,实际经费支出与预算基本相符,执行期间项目组成员共发表论文31篇,其中包括《IEEE Transactions on Evolutionary Computation》、《Briefings in Bioinformatics》、《Bioinformatics》、《PLoS ONE》等SCI期刊论文10篇,EI论文25篇,出版会议论文集1本,获得专利1项,软件著作权2项,超过预期目标。