位置:成果数据库 > 期刊 > 期刊详情页
基于改进的近邻传播聚类算法的Gap统计研究
  • ISSN号:1673-629X
  • 期刊名称:《计算机技术与发展》
  • 时间:0
  • 分类:TP301.6[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]南京理工大学理学院统计与金融数学系,江苏南京210094, [2]海军指挥学院科研部,江苏南京210016
  • 相关基金:全国统计科学研究计划重点项目(2013LZ45)
中文摘要:

由于K-means算法初始聚类中心的选取具有随机性,聚类结果可能不稳定,导致Gap统计估计的聚类数也可能不稳定。针对这些不足,提出一种改进的近邻传播算法-mAP。该算法考察数据的全局分布特性,不同的点赋予不同的P值。在Gap统计中用mAP算法代替K—means算法,提出基于mAP的Gap统计mAPGap。mAP能在较短的时间内得到较好的聚类效果,而且不需要预先设定初始聚类中心,聚类结果更稳定。实验结果表明,mAPGap在估计聚类数的稳定性和聚类精度上都优于原Gap。

英文摘要:

Due to the randomness of choosing the initial clustering of K-means method, it may cause the instability of clustering results and then lead to that of clustering numbers which are estimated by Gap statistic. Taking consideration of those disadvantages, an modified AP clustering (mAP) is presented which utilizes the global distribution to give different P to different points, mAP method is put forward to substitute the K -means in Gap statistic named mAPGap, mAP method has more stable clustering center because the initial clustering center and numbers are not needed in advance and it can get better clustering in short time. The experimental results demonstrate mAPGap is superior to Gap in clustering stability and accuracy.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机技术与发展》
  • 中国科技核心期刊
  • 主管单位:陕西省工业和信息化厅
  • 主办单位:陕西省计算机学会
  • 主编:王守智
  • 地址:西安市雁塔路南段99号
  • 邮编:710054
  • 邮箱:ctad@vip.163.com
  • 电话:029-85522163
  • 国际标准刊号:ISSN:1673-629X
  • 国内统一刊号:ISSN:61-1450/TP
  • 邮发代号:52-127
  • 获奖情况:
  • 《CAJ-CD规范》执行优秀期刊
  • 国内外数据库收录:
  • 中国中国科技核心期刊
  • 被引量:21263