位置:成果数据库 > 期刊 > 期刊详情页
平衡化图半监督学习方法
  • ISSN号:1000-0577
  • 期刊名称:《系统科学与数学》
  • 时间:0
  • 分类:TP181[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]海南大学信息科学技术学院,海口570228, [2]北京凌云光视公司图像处理部,北京100097
  • 相关基金:海南省自然科学基金资助项目(20166211),海南省高等学校科学研究项目(Hjkj2012-01),国家自然科学基金(11261015)资助课题.
中文摘要:

许多机器学习的实际应用中都存在数据不平衡问题,即某类的样本数目要远小于其他类别.数据不平衡会使得分类问题中的分类面过于倾向于适应大类而忽略小类,导致测试样本被错误地判断为大类.针对该问题,文章提出了一种平衡化图半监督学习方法.该方法在能量函数中引入均衡化因子项,使得置信值不仅在图上尽量光滑且在不同类别之间也尽量均衡,有效减小了数据不均衡的不利影响.21个标准数据集上对比实验的统计分析结果表明新方法在数据不平衡时具有显著(显著性水平为0.05)优于支持向量机以及其他图半监督学习方法的分类效果.

英文摘要:

In many real applications of machine learning, there are class imbalance problems, which occurs when the number of one class is much lower than the ones of the other classes. In the framework of imbalanced data set, classifiers would tend to be biased toward the majority class and ignore the minority ones. It may cause samples of minority class being misclassified as majority class ones. Aiming at this problem, this paper proposes balanced graph based semi-supervised learning method (BGSSL). This method introduced an equilibrium factor of classes to energy equation to promise class confidence to be as sooth as possible on graph as well as be as balanced as possible over different classes. It is expected to effectively alleviates the decay of imbalance problem. Statistical analysis of experiments on twenty one datasets demonstrates that BGSSL can provide significantly (significance level of 0.05) better results than SVM and other graph based semi-supervised learning methods on imbalanced datasets.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《系统科学与数学》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院数学与系统科学研究院
  • 主编:张纪峰
  • 地址:北京中关村中国科学院系统科学研究所
  • 邮编:100190
  • 邮箱:jssms@iss.ac.cn
  • 电话:010-62555263
  • 国际标准刊号:ISSN:1000-0577
  • 国内统一刊号:ISSN:11-2019/O1
  • 邮发代号:2-563
  • 获奖情况:
  • 1997年数学类期刊影响因子第三名,2000年获中科院优秀期刊三等奖,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 美国数学评论(网络版),德国数学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:6798