位置:成果数据库 > 期刊 > 期刊详情页
基于Gentle AdaBoost改进算法的不平衡数据分类
  • ISSN号:1001-5868
  • 期刊名称:《半导体光电》
  • 时间:0
  • 分类:TP18[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]南昌航空大学,江西南昌330063
  • 相关基金:国家自然科学基金(60954002);国家重点基础研究发展计划(973计划)项目(2009CB320902);航空科学基金(2010ZC56005)
中文摘要:

传统的GentleAdaboost方法在处理不平衡数据集的分类问题时,通常采用过抽样方法,以达到数据集的平衡。但这样处理通常会引人难以分类的奇异样本,导致分类器的分类性能下降。为此,针对不平衡数据集分类提出了一种改进的GentleAdaBoost算法。考虑到传统GentleAdaBoost算法中容易分类的样本具有较小权重的特点,在分类器的迭代学习过程中,设定一个样本的权重阈值,仅对少数类样本中低权重样本进行复制,然后采用上述数据集进行分类器的训练,得到相应的弱分类器;重复上述步骤进行迭代,在完成平衡数据集的同时,得到强分类器。整个过程可以避免对数据过抽样时引入奇异样本的问题。实验证明了本算法的有效性。

英文摘要:

Traditional Gentle AdaBoost Algorithm always use over-sampling way to accomplish the implementation of minority samples in the process of dealing with the classified issues of unbalanced data set for the purpose of achieving the balance of data set. But this method will incorporate the singular sample which is hard to classified, and lead to the unsatisfied classification performance of the classifier. Therefore, this paper proposes an improved Gentle AdaBoost algorithm specified for the classified issues of unbalanced data set. Firstly, considering the feature that misclassification samples is assigned with a large weight when the classifier is based on Gentle AdaBoost algorithm in training, we can decide the weight threshold for the copy samples, and then, copy a number of minority samples in the threshold range, and use the aforesaid data set to train the classifier and obtain related weak classifier. Repeat the former proce- dures to balance the data set so that the strong classifier can be also obtained. The whole process has the capability of avoiding the issue of incorporating singular samples in the process of data over-sampling. The experiment demonstrates validity of our algorithm.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《半导体光电》
  • 中国科技核心期刊
  • 主管单位:信息产业部
  • 主办单位:中国电子科技集团公司第四十四研究所(重庆光电技术研究所)
  • 主编:江永清
  • 地址:重庆市南岸区南坪花园路14号
  • 邮编:400060
  • 邮箱:soe@163.net
  • 电话:023-65860286
  • 国际标准刊号:ISSN:1001-5868
  • 国内统一刊号:ISSN:50-1092/TN
  • 邮发代号:
  • 获奖情况:
  • 重庆市首届十佳期刊称号,1999年,信息产业部1999-2000年度优秀电子期刊称号
  • 国内外数据库收录:
  • 美国化学文摘(网络版),荷兰文摘与引文数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:5924