位置:成果数据库 > 期刊 > 期刊详情页
基于成对约束的主动学习半监督聚类算法
  • ISSN号:1005-0930
  • 期刊名称:《应用基础与工程科学学报》
  • 时间:0
  • 分类:TP273[自动化与计算机技术—控制科学与工程;自动化与计算机技术—检测技术与自动化装置]
  • 作者机构:[1]湖南商学院计算机与信息工程学院,湖南长沙410205, [2]武汉理工大学计算机科学与技术学院,武汉430070, [3]湖南商学院设计艺术学院,长沙410205, [4]北方导航控制技术股份有限公司,北京100176
  • 相关基金:湖南省自然科学基金项目(10JJ5064,11JJ6051); 教育部人文社科研究一般规划基金项目(11YJAZH039); 湖南省社会科学基金项目(07YBB239); 国家自然科学基金项目(61472136,21106036); 湖南省重点学科建设项目
中文摘要:

半监督学习是近年来机器学习领域中的一个重要研究方向,其监督信息的质量对半监督聚类的结果影响很大,主动学习高质量的监督信息很有必要.提出一种纠错式主动学习成对约束的方法,算法通过寻找聚类算法本身不能发现的成对约束监督信息,将其引入谱聚类算法,利用该监督信息来调整谱聚类中点与点之间的距离矩阵.采用双向寻找的方法,将点与点间距离进行排序,使得学习器即使在接收到没有标记的数据时也能进行主动学习,实现了在较少的约束下可得到较好的聚类结果.同时,该算法降低了计算复杂度,并解决了聚类过程中成对约束的奇异问题.通过在UCI基准数据集以及人工数据集的实验表明,算法的性能好于相关对比算法,并优于采用随机选取监督信息的谱聚类性能.

英文摘要:

Semi-suppervised learning is an important research direction in the field of machine learning in recent years. The performance of semi-supervised clustering depends greatly on the quality of supervision information,so it is necessary to actively learn high quality supervision information. An active learning algorithm based on pair-wise constraints with error correction was proposed in this paper. The algorithm searches the pair-wise constraints information which clustering algorithm cann't find,and leads them into the spectral clustering algorithm. Utilizing suppervised information adjusts the distance matrix between points in the spectral clustering,and sorts the distances by the two-way search method. The algorithm makes the learninger can study actively even the learinger receives the data without flags,and gets better clustering result with less constraints. Meanwhile,the algorithm reduces the computational complexity of the semi-supervised algorithms based on constraints and resolves the singular problem of the pairwise constraints in the clustering process. Experimental results on UCI benchmark data sets and artificial data set state clearly the performance of the algorithm is better than that of other compared algorithms,and that of the spectral clustering which randomly selects the supervision information.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《应用基础与工程科学学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国自然资源学会
  • 主编:倪晋仁
  • 地址:北京大学环境大楼312室
  • 邮编:100871
  • 邮箱:jbse@iee.pku.edu.cn
  • 电话:010-62753153
  • 国际标准刊号:ISSN:1005-0930
  • 国内统一刊号:ISSN:11-3242/TB
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 荷兰文摘与引文数据库,美国工程索引,中国中国科技核心期刊,中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:7313