位置:成果数据库 > 期刊 > 期刊详情页
基于支持向量机的不平衡数据分类的改进欠采样方法
  • ISSN号:0529-6579
  • 期刊名称:中山大学学报(自然科学版)
  • 时间:2012
  • 页码:10-16
  • 分类:TP391.4[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]中山大学信息科学与技术学院∥智能传感器网络教育部重点实验室,广东广州510006
  • 相关基金:国家自然科学基金资助项目(U1135005)
  • 相关项目:跨媒体协同处理与服务的理论和应用研究
中文摘要:

支持向量机作为一种有监督分类算法,具有小样本,非线性等独特优势,但其在处理不平衡数据分类时效果不够理想。欠采样是一类常用的数据重构方法,它被广泛用于解决不平衡数据的分类问题,然而,传统的随机欠采样方法受随机性影响,稳定性较差。提出一种改进的欠采样方法,并应用在支持向量机上进行分类对比实验。实验结果表明,相比传统随机欠采样方法,该方法的稳定性更好,且在许多情况下可以提高支持向量机对不平衡数据的分类性能。

英文摘要:

As a supervised classifier, Support Vector Machine (SVM) has prominent advantages in solving some problems on petty and nonlinear datasets, but it is unsatisfying in tackling with imbalanced datasets. Random under-sampling has been a widely used method to improve SVM's performance on imbalanced data, but its stability is easily influenced by the nature of randomness. A modified SVM based on under-sampling method is presented to classify imbalanced data. Compared with the random undersampling technique, it is shown through experiments on natural datasets that the new proposed undersampling method is more stable in classifying imbalanced data, and exhibits improved SVM performance in classifying imbalanced data for many cases.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《中山大学学报:自然科学版》
  • 北大核心期刊(2011版)
  • 主管单位:国家教育部
  • 主办单位:中山大学
  • 主编:王建华
  • 地址:广州市新港西路135号
  • 邮编:510275
  • 邮箱:xuebaozr@mail.sysn.edu.cn
  • 电话:020-84111990
  • 国际标准刊号:ISSN:0529-6579
  • 国内统一刊号:ISSN:44-1241/N
  • 邮发代号:46-15
  • 获奖情况:
  • 全国优秀高等学校自然科学学报及教育部优秀科技期...,广东省优秀科学技术期刊一等奖,《中文核心期刊要目总览》综合性科技类核心期刊,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 美国化学文摘(网络版),美国数学评论(网络版),英国农业与生物科学研究中心文摘,德国数学文摘,荷兰文摘与引文数据库,美国剑桥科学文摘,英国动物学记录,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),英国英国皇家化学学会文摘,中国北大核心期刊(2000版)
  • 被引量:18509