大间隔分类方法是目前主流的分类方法之一,已成为国内外机器学习和模式识别领域的一个研究热点。降维和模型解的稀疏化是改进大间隔分类器性能的有效策略,但当前同时进行双重稀疏化(“特征稀疏化”和“模型解的稀疏化”)的大间隔分类器研究还不多见。为此,本项目旨在寻求特征选择的新策略、具有稀疏化解的大间隔分类模型设计及双重稀疏化的大间隔分类器集成三个方面展开研究。侧重研究1)能充分利用局部和全局信息的基于假设间隔的特征选择算法设计;2)并入假设间隔的Rough集模型设计,寻求Rough集模型和统计学习理论有效结合的新策略;3)将隐含在经典特征选择模型中的类信息和FCM结合的聚类模型设计,为有效保持隐含在样本空间中的“数据结构”的特征选择模型设计提供新的思路。在上述研究的基础上,进而研究1)一类双重稀疏化的大间隔分类器设计;2)双重稀疏化的大间隔分类器的集成。
英文主题词feature selection;large margin classifier;rough set