位置:成果数据库 > 期刊 > 期刊详情页
近邻传播的文本聚类集成谱算法
  • ISSN号:1006-7043
  • 期刊名称:《哈尔滨工程大学学报》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]哈尔滨工程大学信息与通信工程学院,黑龙江哈尔滨150001, [2]中国人民解放军91685部队,海南陵水572400
  • 相关基金:国家自然科学基金资助项目(60975042).
中文摘要:

针对现有聚类集成谱算法聚类结果不稳定的问题,引入近邻传播聚类思想,设计了基于近邻传播的聚类集成谱算法(APCESA).该算法先由聚类集成和谱分得到空间结构相对简单的文本低维嵌入,然后通过近邻传播算法得到最终的聚类结果.在谱分解过程中,采用矩阵变换方法,避免了谱算法中特征值分解的高昂计算代价.对真实文本数据集的实验结果表明,所提算法比对比算法聚类更稳定,且聚类结果的NMI值和ANMI值均高于对比算法.

英文摘要:

The existing cluster ensemble spectral algorithm are mostly unstable. To solve this problem, an affinity propagation-based cluster ensemble spectral algorithm was proposed, which brings in the idea of affinity propagation clustering. The algorithm utilized cluster ensemble and spectral analysis to achieve the low dimensional embedding of documents, and obtained the final clustering results by using an affinity propagation clustering algorithm. To avoid the high computational cost of eigenvalue decomposition in a spectral algorithm, matrix transformation was used in this paper. Experiments using real-world document sets show that the proposed algorithm is more stable than the compared methods, both NMI and ANMI values of the clustering result are higher than that of the comparison method.

同期刊论文项目
期刊论文 44 会议论文 12
同项目期刊论文
期刊信息
  • 《哈尔滨工程大学学报》
  • 中国科技核心期刊
  • 主管单位:中华人民共和国工业和信息化部
  • 主办单位:哈尔滨工程大学
  • 主编:杨士莪
  • 地址:哈尔滨市南岗区南通大街145号1号楼
  • 邮编:150001
  • 邮箱:xuebao@hrbeu.edu.cn
  • 电话:0451-82519357
  • 国际标准刊号:ISSN:1006-7043
  • 国内统一刊号:ISSN:23-1390/U
  • 邮发代号:14-111
  • 获奖情况:
  • 工信部科技期刊评比"优秀期刊奖",中国高校科技期刊评比"精品期刊奖","北方十佳期刊奖",首届黑龙江省政府出版奖--优秀期刊奖
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),美国数学评论(网络版),波兰哥白尼索引,德国数学文摘,荷兰文摘与引文数据库,美国工程索引,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:11823