位置:成果数据库 > 期刊 > 期刊详情页
基于SVM的Web文本快速增量分类算法
  • ISSN号:1001-3695
  • 期刊名称:《计算机应用研究》
  • 时间:0
  • 分类:TP393.09[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]江苏大学计算机科学与通信工程学院,江苏镇江212013
  • 相关基金:高校博士点基金资助项目(20093227110005); 校高级人才启动基金资助项目(09JDG041); 省科技型企业创新资金资助项目(BC2010172)
中文摘要:

针对基于支持向量机的Web文本分类效率低的问题,提出了一种基于支持向量机Web文本的快速增量分类FVI-SVM算法。算法保留增量训练集中违反KKT条件的Web文本特征向量,克服了Web文本训练集规模巨大,造成支持向量机训练效率低的缺点。算法通过计算支持向量的共享最近邻相似度,去除冗余支持向量,克服了在增量学习过程中不断加入相似文本特征向量而导致增量学习的训练时间消耗加大、分类效率下降的问题。实验结果表明,该方法在保证分类精度的前提下,有效提高了支持向量机的训练效率和分类效率。

英文摘要:

In Web text classification,with extremely large scale of the training set and the characteristic of changing rapidly,this paper proposed an algorithm named FVI-SVM based on incremental SVM for fast Web text classification.In order to conquer the problem of low efficiency of SVM which was aroused by a large scale of training set,datas in incremental training set which violate conditions of KKT would be exterminated.In order to conquer the problem of redundant support vectors which lead to the increasing of taining time consumption and decreasing of classification efficiency in incremental learning,exterminated the redundant support vectors by calculating shared nearest neighbors similarity.Experimental results show that the proposed method enhances the training and classification efficiency on a premise ensure the accuracy of classification.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机应用研究》
  • 北大核心期刊(2011版)
  • 主管单位:四川省科学技术厅
  • 主办单位:四川省计算机研究院
  • 主编:刘营
  • 地址:成都市成科西路3号
  • 邮编:610041
  • 邮箱:arocmag@163.com
  • 电话:028-85210177 85249567
  • 国际标准刊号:ISSN:1001-3695
  • 国内统一刊号:ISSN:51-1196/TP
  • 邮发代号:62-68
  • 获奖情况:
  • 第二届国家期刊奖百种重点科技期刊,国内计算技术类重点核心期刊,国内外著名数据库收录期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:60049