位置:成果数据库 > 期刊 > 期刊详情页
一种改进的可并行的K-medoids聚类算法
  • ISSN号:1674-9324
  • 期刊名称:《教育教学论坛》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:山西大学商务学院,太原030031
  • 相关基金:2014年省科技厅基础研究项目(2014011018-1); 2015年学院科研项目(2015009)
作者: 马晓慧
中文摘要:

针对K-medoids算法中初始聚类中心的结点的选取的随机性导致影响聚类结果质量的问题,采用标签共现原则对该算法进行改进。根据标签共现频率和相似度先对标签进行聚类,根据标签聚类结果,选取K个由其代表的资源作为聚类初始中心结点。通过聚类中心的优化设置,降低了抽样选取的随机性。最后采用MapReduce框架对其进行并行化,以豆瓣图书的标签数据为应用背景进行实验,验证了算法的实用性。

英文摘要:

The K-medoids algorithm suffered from one problem which the quality of clustering results was sensitive to the initial clustercenters selection. The paper improves the algorithm using the principle of the tag co-occurrence. According to the tag co-occurrencefrequency and similarity, clustering is carried out on the tags, and K resources are selected as the initial clustering center nodes on thebasis of different tag cluster. After that, the paper reduces the randomness of sampling selection by optimizing the clustering center.Furthermore, MapReduce framewok is adopted to carry out the parallel algorithm. Finally through the experiment with the applicationbackground of Douban books, the experimental result verifies the practicability of the algorithm.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《教育教学论坛》
  • 主管单位:河北出版传媒集团有限责任公司
  • 主办单位:河北教育出版社有限责任公司 花山文艺出版社有限责任公司 花山文艺出版有限责任公司
  • 主编:韩新保
  • 地址:石家庄市联盟路705号
  • 邮编:050061
  • 邮箱:jyjxlt@jyjxltzzs.com
  • 电话:0311-87760976
  • 国际标准刊号:ISSN:1674-9324
  • 国内统一刊号:ISSN:13-1399/G4
  • 邮发代号:18-219
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:45209