位置:成果数据库 > 期刊 > 期刊详情页
基于最大化间隔准则和成对约束的鲁棒半监督聚类研究
  • ISSN号:1002-0470
  • 期刊名称:《高技术通讯》
  • 时间:0
  • 分类:TP181[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]东南大学仪器科学与工程学院,南京210096
  • 相关基金:国家自然科学基金(61105048,60972165,51175080),教育部博士点基金(20100092120012,20110092120034),人事部留学人员科技活动择优资助基金(6722000008)和江苏省自然科学基金(BK2010240,BK2010423)资助项目.
中文摘要:

针对现有半监督最大间隔聚类算法在不同类别中有不少样本非常相似的情况下难以提高聚类准确度的问题,提出了下述解决策略:首先,基于最大化间隔准则设计一种鲁棒的成对约束损失函数,即使不同类别有较多样本非常相似,该函数仍然能有效地检测不能满足成对约束的聚类结果,并提供相应的惩罚,从而能较好地提高聚类的性能。其次,基于约束凹凸过程设计一种迭代算法进行求解。进而,基于这一策略,提出了一种新的聚类算法——鲁棒的成对约束最大化间隔聚类(BPCMMC)算法。实验结果表明,该算法能有效克服现有半监督最大间隔聚类算法的不足,其聚类错误率明显低于传统的半监督聚类算法。

英文摘要:

To solve the problem that the existing semi-supervised maximum margin clustering algorithm does not work ro- bustly when lots of very similar samples exist in different categories, this study adopted the tactics below : Firstly, design a robust loss function for violating the pairwise constraints based on the maximum margin principle, which features robust penalization to the violation of the pairwise constraints; Secondly, design an iterative algorithm based on the constrained concave-convex procedure (CCCP) to improve the clustering accuracy. Based on the tac- tics, a new semi-supervised clustering algorithm, the robus pairwise constrained maximum margin clusting (RPCM- MC) algorithm, was put forward. The experimental results demonstrate that the proposed algorithm can overcome the drawbacks of the existing semi-supervised maximum margin clustering algorithm and outperform some represent- ative semi-supervised clustering algorithms.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《高技术通讯》
  • 北大核心期刊(2011版)
  • 主管单位:中华人民共和国科学科技部
  • 主办单位:中国科学技术信息研究所
  • 主编:赵志耘
  • 地址:北京市三里河路54号
  • 邮编:100045
  • 邮箱:hitech@istic.ac.cn
  • 电话:010-68514060 68598272
  • 国际标准刊号:ISSN:1002-0470
  • 国内统一刊号:ISSN:11-2770/N
  • 邮发代号:82-516
  • 获奖情况:
  • 《中国科学引文数据》刊源,《中国科技论文统计与分析》刊源
  • 国内外数据库收录:
  • 美国化学文摘(网络版),荷兰文摘与引文数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),英国英国皇家化学学会文摘
  • 被引量:12178