支持向量机是当前公认最有效的分类与回归的机器学习方法,广泛应用于各个领域。基于非平行超平面支持向量机是支持向量机研究中的一项新的突破,它以训练时间少和推广能力强受到了广泛重视,并已经成为支持向量机中的一个新研究热点。对此本课题组也取得了若干有意义的初步成果。本项目拟在这些成果基础上,针对标准的分类和回归问题以及类别不均衡的问题,构建各种非平行超平面支持向量机模型和算法首先,针对分类和回归问题提出基于最大间隔思想的各种非平行超平面支持向量机模型和求解算法,并给出其最优化理论框架;其次,对类别不均衡问题提出基于重采样和代价敏感学习的非平行超平面支持向量机模型、局部全局的非平行超平面支持向量机模型;最后,针对生物信息学中蛋白质功能预测和结构分析问题具有类别不均衡和局部信息相对重要等特点,在以上模型基础上提出更有效的模型。本课题将为非平行超平面支持向量机的研究和应用提供理论、方法和技术支持。
英文主题词Optimization method;data mining;support vector machines;nonparallel SVMs;pattern recognition