位置:成果数据库 > 期刊 > 期刊详情页
不平衡数据学习算法在相似性学习中的应用
  • ISSN号:1003-6059
  • 期刊名称:《模式识别与人工智能》
  • 时间:0
  • 分类:TP181[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]苏州大学计算机科学与技术学院,苏州215006
  • 相关基金:国家自然科学基金项目(No.61373093,61033013)、江苏省自然科学基金项目(No.BK2011284,BK201222725,BK20140008)、江苏省高校自然科学研究项目(No.13KJA520001)、江苏省青蓝工程项目资助
中文摘要:

在现实问题中,相似性学习的样本对存在不平衡现象,即相似性样本对的数量会远小于不相似性样本对的数量.针对此问题,文中提出两种样本对构造方法——不相似K近邻-相似K近邻(DKNN—SKNN)和不相似K近邻-相似K远邻(DKNN—SKFN).运用这两种方法可有针对性地选择相似性学习样本对,不仅可加快支持向量机的训练过程,而且在一定程度上解决样本对之间的不平衡问题.在多个数据集上进行文中方法和经典的重采样方法的对比实验,结果表明DKNN—SKNN和DKNN—SKFN具有良好性能.

英文摘要:

In the real-world problems, there is an imbalance in the paired-samples. The number of the paired- samples in similarity set is much smaller than the number of the paired-samples in dissimilarity set. To solve this problem, two approaches, dissimilar K nearest neighbor and similar K nearest neighbor (DKNN-SKNN) and dissimilar K nearest neighbor and similar K farthest neighbor ( DKNN-SKFN), are proposed to construct paired-samples. Thus, the number of paired-samples in similarity learning is effectively decreased, the training process of SVM is accelerated, and the imbalanced data problem is solved to some degree. In the experiments, the proposed approaches are compared with some standard resampling methods. The results show that the proposed approaches have better performance.

同期刊论文项目
期刊论文 86 会议论文 13 获奖 3 专利 2 著作 3
同项目期刊论文
期刊信息
  • 《模式识别与人工智能》
  • 中国科技核心期刊
  • 主管单位:中国科学技术协会 中国自动化学会
  • 主办单位:国家智能计算机研究开发中心 中国科学院合肥智能机械研究所
  • 主编:郑南宁
  • 地址:安徽省合肥市蜀山湖路350号中国科学院合肥智能机械研究所
  • 邮编:230031
  • 邮箱:bjb@iim.cas.cn
  • 电话:0551-5591176
  • 国际标准刊号:ISSN:1003-6059
  • 国内统一刊号:ISSN:34-1089/TP
  • 邮发代号:26-69
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:10169