位置:成果数据库 > 期刊 > 期刊详情页
近邻传播聚类算法的优化
  • ISSN号:1001-9081
  • 期刊名称:《计算机应用》
  • 时间:0
  • 分类:O212.1[理学—概率论与数理统计;理学—数学]
  • 作者机构:南京理工大学统计与金融数学系,南京210094
  • 相关基金:全国统计科学研究计划重点项目(2013LZ45).
作者: 唐丹, 张正军
中文摘要:

针对近邻传播聚类(AP)算法相似度度量公式的局限性和偏向参数的选取没有考虑数据的分布特性的不足,提出一种基于加权马氏距离和隶属度优化的近邻传播聚类算法APBWMMP。该算法提出基于均方差的马氏距离赋权法,用加权马氏距离替换相似度度量中的欧氏距离,并利用特征值、特征矢量及伪逆运算来解决马氏距离中遇到的奇异值问题;根据数据的分布结构,建立隶属度模型,对不同点赋予不同的偏向参数值;同时提出了一种自适应步长,动态调整偏向参数值进行聚类的方法。根据Gap指标估计每次最佳聚类数。实证表明,该算法具有可行性和优越性。

英文摘要:

Due to the application limitation of distance vertor formula and the weakness of the preference selection with Affinity Propagation( AP), an optimized affinity propagation clustering algorithm based on weighted Mahalanobis distance and modified preference was proposed. In order to meet the requirements of different units of measurement data, the weighted Mahalanobis distance based on convariance was used to calculate the similarity. There are efficient methods to solve singular value problem for finding eigen-values and eigenvectors of a symmetric matrix and computing pseudo-inverse matrix in finding the Mahalanobis distance. In addition, the preference was determined by computing the membership of sample set, and the data distribution was considered to set different preference parameters to different points. Experiment results illustrate its effectiveness and feasibility.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机应用》
  • 北大核心期刊(2011版)
  • 主管单位:四川省科学技术协会
  • 主办单位:四川省计算机学会中国科学院成都分院
  • 主编:张景中
  • 地址:成都市人民南路四段九号科分院计算所
  • 邮编:610041
  • 邮箱:xzh@joca.cn
  • 电话:028-85224283
  • 国际标准刊号:ISSN:1001-9081
  • 国内统一刊号:ISSN:51-1307/TP
  • 邮发代号:62-110
  • 获奖情况:
  • 全国优秀科技期刊一等奖,国家期刊奖提名奖,中国期刊方阵双奖期刊,中文核心期刊,中国科技核心期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:53679