SVM是当今机器学习领域的一种重要的主流学习方法,本项目针对SVM的核选择方法及其在应用中的建模问题开展研究。取得的研究成果主要有(1)将SVM的核选择问题统一在SVM学习的框架下,给出了泛化误差上界的极小化估计;建立了基于数据依赖的模型选择的严格优化数学模型。(2)提出了基于凸包估计的核参数选择方法,从几何上解释了核选择方法的意义;通过分析样本的分布特性,提出了基于数据分布和基于数据独立性的核选择方法;通过分析高斯核参数与视觉模拟尺度空间的尺度参数的关联性,从理论上证明了对于任意给定问题,都可以找出一个高斯核参数区间。(3)通过将增量学习技术和核选择方法相结合,建立了SVM的分类和回归在线学习方法。(4)通过将数据的时序关系作为核构造的经验知识,将领域知识与SVM建模进行了融合;(5)将SVM与集成学习、半监督、粒度计算相结合,提高了SVM的泛化能力和应用范围。(6)将上述理论成果应用于空气质量预测和中文电子邮件过滤领域。本项目获得的成果丰富了SVM的核选择理论研究,提高了SVM在实际领域中的应用能力,同时对其他学习机的模型选择问题也有积极的借鉴作用。
英文主题词support vector machine; kernel selection; online learning; prediction modelling