位置:成果数据库 > 期刊 > 期刊详情页
非线性分类的分割超平面快速集成方法
  • ISSN号:1009-5896
  • 期刊名称:电子与信息学报
  • 时间:0
  • 页码:535-542
  • 分类:TP391.4[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]湖州师范学院信息与工程学院,湖州313000, [2]江南大学数字媒体学院,无锡214122
  • 相关基金:国家自然科学基金(60975027,61170122); 江苏省自然科学基金重点项目(BK2011003); 江苏省普通高校研究生科研创新计划(CXZZ11_0483)资助课题
  • 相关项目:鲁棒的目标跟踪和识别新方法及在羽绒识别中的应用研究
中文摘要:

直接营销策略的分割超平面(Separating HyperPlane,SHP)方法所构建的线性超平面(Linear HyperPlane,LHP)函数集的Vapnik-Chervonenkis(VC)维不超过9,并且能够快速分类和保护数据隐私,但其训练速度慢,对样本分布敏感以及不能解决非线性等问题。为此,该文提出一种适合大样本问题的非线性分类方法,称为分割超平面的快速集成方法(Fast Ensemble of Separating HyperPlane,FE-SHP)。此方法先将训练样本划分为多个集合并分别构造它们的次优线性超平面,然后利用径向基函数(Radical Basis Function,RBF)改善次优线性超平面的非线性能力,同时引进优化权提升次优线性超平面的非线性集成效果,并将集成输出转化为概率输出,进而通过梯度下降法最大化训练样本的交叉熵对数似然函数求解相关参数。UCI数据集的实验结果表明,FE-SHP在处理大样本方面具有较好的优势。

英文摘要:

Although the function set of Linear HyperPlane(LHP) obtained from the Separating HyperPlane(SHP) method based on direct marketing campaigns has a very low Vapnik-Chervonenkis dimension equal to 9 or lower and the corresponding optimized LHP can fast detect unseen instance and preserve user's privacy,it is inefficient in training speed,sensitive to training examples and not able to apply to nonlinear datasets.For overcoming these drawbacks as above,a nonlinear classification approach is proposed in this paper,which is suitable for large datasets and called Fast Ensemble of Separating HyperPlane(FE-SHP).First,the original training data is split into several subsets and their suboptimal LHPs are respectively constructed.Then,the nonlinear ensembling effects of suboptimal LHPs are enhanced by introducing an optimized weight vector after improving their nonlinear capabilities with Radical Basis Function(RBF).Finally,the related parameters are solved by the gradient descent method to maximize a log likelihood function which is the cross-entropy error of training data following the ensembling output of suboptimal LHPs being mapped probabilities.Experimental results on UCI demonstrate that the presented FE-SHP obtains competitive effectiveness for large datasets.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《电子与信息学报》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院电子学研究所 国家自然科学基金委员会信息科学部
  • 主编:朱敏慧
  • 地址:北京市北四环西路19号
  • 邮编:100190
  • 邮箱:jeit@mail.ie.ac.cn
  • 电话:010-58887066
  • 国际标准刊号:ISSN:1009-5896
  • 国内统一刊号:ISSN:11-4494/TN
  • 邮发代号:2-179
  • 获奖情况:
  • 国内外数据库收录:
  • 荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:24739