位置:成果数据库 > 期刊 > 期刊详情页
面向不均衡小样本训练集的改进Boosting算法
  • ISSN号:0253-2778
  • 期刊名称:中国科学技术大学学报
  • 时间:0
  • 页码:146-151
  • 分类:TP18[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]微软-教育部多媒体计算与通信联合实验室,安徽合肥230027, [2]中国科学技术大学电子科学与技术系,安徽合肥230027
  • 相关基金:国家自然科学基金(U0835002),教育部-微软重点实验室研究基金(07122808)资助.
  • 相关项目:数字家庭智能化的基础算法理论与关键技术的研究
中文摘要:

传统的Boosting算法训练出的分类器常会出现过拟合和向多数类偏移.为此,提出一种基于自适应样本注入和特征置换的Boosting学习算法,通过在训练过程中加入人工合成样本,逐渐平衡训练集,并通过合成的样本对分类器学习进行扰动,使分类器选择更多有效的特征,提高了分类器的泛化能力.最后,在两类和多类图片分类问题上对该算法的有效性进行了考察,实验结果表明,该算法能够在样本数很少,且正负样本数量极不均衡的情况下,有效提高booting算法的泛化能力.

英文摘要:

Traditional Boosting algorithms tend to overfit and be biased towards the majority class on small and imbalanced training sets. To address this issue, an improved Boosting learning algorithm with adaptive sample injecting and feature knock out was proposed. In the training process, synthetic samples were appended to the original training set to rebalance it and disturb and enhance its generalization ability. The method was tested on both two-class and multi-class image classification problems. Experiment results show that when the number of training samples is small, and the distribution of training set is imbalanced, the proposed method can enhance the generalization performance of Boosting algorithms effectively.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《中国科学技术大学学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国科学技术大学
  • 主编:何多慧
  • 地址:安徽省合肥市金寨路96号
  • 邮编:230026
  • 邮箱:JUST@USTC.EDU.CN
  • 电话:0551-63601961 63607694
  • 国际标准刊号:ISSN:0253-2778
  • 国内统一刊号:ISSN:34-1054/N
  • 邮发代号:26-31
  • 获奖情况:
  • 1999年,全国优秀高等学校自然科学学报及教育部优...,2001年,安徽省1999-2001年度优秀科技期刊一等奖,2002年,第三届华东地区优秀期刊奖
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:8237