双胞胎支持向量机是一种新颖的支持向量机算法,其模型转化为求解两个较小规模的二次规划问题,而不是标准支持向量机的一个较大规模的二次规划问题,因此它的运算速度提高了四倍,近两年它受到高度重视。但为正类样本点构造分类超平面时,所有的正类样本点都参与了目标函数的构建,而只有小数错分的负类点参入其中,这对正类点容易产生"过拟合"现象,降低模型的预测能力。另外模型中对那些错分的负类点给予了相同的惩罚,而实际上它们所处的位置不同,对超平面有着不同的影响。 根据以上两点缺陷,对现有的双胞胎支持向量机进行改进是很有必要的。本项目将粗糙集理论引入到双胞胎支持向量机中,通过构造粗糙上间隔、粗糙下间隔和粗糙边界,这样更多的负类点被考虑了;同时对位于下间隔中的负类点给予较大的惩罚,对位于粗糙边界中的负类点给予较小的惩罚,改进后的模型将具有更强的推广能力。本项目将围绕分类和回归问题进行详细地研究。
Support vector machine;Rough set theory;Rough margin;Rough twin SVM;
项目组成员通过短短一年的研究,取得了可喜的研究成果,2012年共发表7篇标注基金号的被SCI、EI检索的科研论文,其中项目申请人以第一作者身份发表5篇。另有3篇未标注基金号的被SCI、EI检索的国外期刊论文。主要成果如下 1、构建了基于粗糙间隔的双胞胎支持向量分类机. 通过构造粗糙上间隔、下间隔和粗糙边界,对位于不同间隔中的数据点给予不同的惩罚。同时更多的数据点在目标函数中被考虑到,这从一定程度上克服了“过拟合”问题,从而增强了模型的推广能力。另外我们还对模型中的参数进行了相关的研究,得到支持向量比例的下界和错分比例的上界。 2、构建基于加权的双胞胎支持向量回归机. 在构造上、下界函数时,对不同位置的数据点给予不同的惩罚,起到了加权的作用。与经典的支持向量回归机和双胞胎支持向量回归机相比,加权双胞胎支持向量回归机拥有较强的泛化能力。另外我们还对加权样本的比例进行了相关的研究。 3、构建了基于结构风险最小化的双胞胎最小二乘支持向量分类机. 通过在目标函数中引入了规则化项,使改进的双胞胎最小二乘支持向量分类机遵循结构风险最小化原则而不是经验风险最小化原则,提高了模型的泛化能力。 4、构建一种双胞胎多分类支持向量机. 将双胞胎的思想引入到多分类问题中,构建了双胞胎多分类支持向量机。该模型充分利用TSVM和K-SVCR的优势,采用了1对1对余的结构,因此产生三输出结果。由于所有训练样本点的信息都被充分利用,因此产生了较高的预测精度。 另外,我们在多输出支持向量回归机,支持向量机的鲁棒性等方面也做了相关的研究。