特征选择是模式识别领域的研究热点之一,它在模式识别中占有相当重要的地位。传统的特征选择方法主要集中在信息准则的研究上, 但当模型的自变量比较多时,信息准则因为计算量过大而变得无能为力,Lasso方法很好地克服了传统方法的不足。但是,Lasso方法也有一定的局限性,很多学者对它提出了改进。目前,Lasso及其改进方法已经得到了统计学界和模式识别界的特别关注,并在许多领域都得到了很好的应用。因此,进一步开展对Lasso改进方法及应用的研究具有重要的科学意义和实际价值。本项目的研究内容为1)基于模型的Lasso改进方法及算法研究,主要研究带约束多元回归模型的Lasso改进方法及算法;2)基于熔合惩罚最小二乘的Lasso改进方法与算法,并探索其在中药指纹图谱识别中的应用;3)基于确定时间序列ARMA模型阶数和估计未知参数的Lasso改进方法与算法,并研究其在交通流预测和分析中的应用。
Feature Selection;Improved Lasso Methods;Polynomial Splines Estimation;Random Simulation Algorithm;Autoregressive Model
本项目以统计模式识别理论、运筹优化理论、时间序列理论以及Monte Carlo方法为基础,取得了以下研究成果。系统研究了基于模型的Lasso改进方法,如COX模型、随机删失模型、Logistic模型和Poisson模型等;提出了二种新的算法—随机模拟算法和投影深度算法。研究了几类基于损失函数和惩罚函数的Lasso改进方法,如基于自适用惩罚的特征选择方法、基于SCAD惩罚的多样条估计方法、基于Elastic Net的特征选择方法和基于二阶融合的Fused Lasso方法等;探索了二阶融合的Fused Lasso方法在指纹图谱和蛋白质质谱中的应用。研究了无限方差自回归模型的参数估计和特征选择问题,验证了自加权综合分位数回归估计方法的优良性;给出了几类可用于交通流预测模型的求解方法并分析了解的性质。此外,本项目还研究了其它特征选择方法的影响分析问题,线性和半线性EV模型参数线性约束的检验问题以及带约束多元回归模型参数估计的优良性问题等。本项目从理论和应用二方面,对于推动模式识别的特征选择研究做出了新的贡献。本项目已经资助发表相关的研究论文22篇,其中SCI检索论文13篇,EI检索论文5篇。培养硕士研究生18名,博士3名。邀请国外科学家来华进行学术交流6人次,课题组出国交流访问3人次。我们按计划进行研究,顺利解决了各关键科学问题,完成了各项预定目标,并有额外的收获。