位置:成果数据库 > 期刊 > 期刊详情页
SVM在非平衡数据集中的应用
  • ISSN号:1673-629X
  • 期刊名称:《计算机技术与发展》
  • 时间:0
  • 分类:TP181[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]南京师范大学教育科学学院,江苏南京210097
  • 相关基金:基金项目:全国教行科学“十五”规划教育部重点基金项目(DCA050056);江苏省教育科学“十一五”规划项目(D/2006/01/096)
中文摘要:

在一个数据集中,至少有一个类别相对与其他类别有很少的样本,则这样数据集可以称为高度倾斜的或者是非平衡的数据集,非平衡数据在现实中普遍存在。在非平衡数据分类中.传统机器学习算法的分类表现受到了阻碍。支持向量机(SVM)基于结构风险最小化原则,是近几年发展起来的机器学习方法。分析了SVM在非平衡数据集中的应用情况,同时提出了几种SVM运用于非平衡数据集中的主要改进方法,这些方法对于非平衡数据的分类有很好的分类效果。

英文摘要:

A training data.set is called imbalance if at least one of the classes are represented by significantly less number of instances than the others. The class imbalance problem occurs when there is significantly less number of observations of the target concept. Various real - world classification tasks suffer from this phenomenon. The class imbalance problem has been known to hinder the learning performance of classification algorithms. The support vector machine theory is based on the minimization principle to structure risk. Support vector machine is an algorithm of machine learning that has developed during these years. Summarizes the state of the application of SVM in imbalances data. Then introduce some algorithms improved to get good performance.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机技术与发展》
  • 中国科技核心期刊
  • 主管单位:陕西省工业和信息化厅
  • 主办单位:陕西省计算机学会
  • 主编:王守智
  • 地址:西安市雁塔路南段99号
  • 邮编:710054
  • 邮箱:ctad@vip.163.com
  • 电话:029-85522163
  • 国际标准刊号:ISSN:1673-629X
  • 国内统一刊号:ISSN:61-1450/TP
  • 邮发代号:52-127
  • 获奖情况:
  • 《CAJ-CD规范》执行优秀期刊
  • 国内外数据库收录:
  • 中国中国科技核心期刊
  • 被引量:21263