位置:成果数据库 > 期刊 > 期刊详情页
基于最小包含球的大数据集域自适应快速算法
  • ISSN号:1003-6059
  • 期刊名称:《模式识别与人工智能》
  • 时间:0
  • 分类:TP[自动化与计算机技术]
  • 作者机构:[1]江南大学数字媒体学院,无锡214122, [2]常熟理工学院计算机科学与工程学院,常熟215500
  • 相关基金:国家自然科学基金(60975027,61170122);江苏省自然科学基金(BK2011003)资助
中文摘要:

现有的领域白适应方法在定义领域问分布距离时,通常仅从领域样本的整体分布上考虑,而未对带类标签的领域样本分布分别进行考虑,从而在一些具有非平衡数据集的应用领域上表现出一定的局限性.对此,在充分考虑源领域样本类信息的基础上,基于结构风险最小化模型,提出了基于类分布的领域自适应支持向量机(DomainadaptationsupportvectormachinebasedOilclassdistribution,CDASVM),并将其拓展为可处理多源问题的多源领域自适应支持向量机(CDASVMfrommultiplesources,MSCDASVM),在人造和真实的非平衡数据集上的实验结果表明,所提方法具有优化或可比较的模式分类性能.

英文摘要:

Current domain adaptation methods almost focus on the whole domain sample's distribution and ignore the sample's label information when they consider the distribution discrepancy between source domain and target domain. So, these methods may not work well on imbalanced datasets. In the paper, we employ the proposed distribution discrepancy which considers the sample's label information in the source domain and then propose a novel domain adaptation learning method based on the structure risk minimization principle, called support vector machine for domain adaptation based on class distribution (CDASVM). Accordingly, the CDASVM is extended to MSCDASVM (CDASVM from multiple sources) which can be used to deal with the domain adaptation problem from multiple sources. Experimental results on artificial and real imbalanced datasets show that the proposed machines CDASVM and MSCDASVM outperform or are comparable to the related domain adaption methods.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《模式识别与人工智能》
  • 中国科技核心期刊
  • 主管单位:中国科学技术协会 中国自动化学会
  • 主办单位:国家智能计算机研究开发中心 中国科学院合肥智能机械研究所
  • 主编:郑南宁
  • 地址:安徽省合肥市蜀山湖路350号中国科学院合肥智能机械研究所
  • 邮编:230031
  • 邮箱:bjb@iim.cas.cn
  • 电话:0551-5591176
  • 国际标准刊号:ISSN:1003-6059
  • 国内统一刊号:ISSN:34-1089/TP
  • 邮发代号:26-69
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:10169