位置:成果数据库 > 期刊 > 期刊详情页
基于MapReduce的可扩展协同聚类算法
  • ISSN号:1006-2475
  • 期刊名称:计算机与现代化
  • 时间:2013
  • 页码:52-57
  • 分类:TP301.6[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]江西师范大学计算机信息工程学院,江西南昌330022
  • 相关基金:国家自然科学基金资助项目(60963014,61163006)
  • 相关项目:大规模数据聚类的并行进化算法骨架研究
中文摘要:

协同聚类算法是通过同时对文档和特征进行聚类的一种聚类算法,该算法可以挖掘文档内部特征之间的潜在关系从而达到提高聚类效果的目的。随着大数据时代的到来,算法的并行化显示出它的优越性,为此本文对协同聚类算法进行全面的研究,并扩展它的并行算法,研究基于最小化残差平方和的协同聚类算法,利用MapReduce模式设计与实现协同聚类算法的并行化。实验结果表明,本文提出的并行协同聚类算法能够提高聚类的效率,并具有很好的可扩展性。

英文摘要:

Collaborative clustering algorithm is a kind of clustering algorithm to cluster the documents and the features at the same time, this algorithm can find the potential relationship between internal document features so as to improve the clustering effect. With the arrival of the era of big data, parallel algorithm showed its superiority, this paper carries out a comprehensive research on collaborative clustering algorithm, and extends the parallel algorithm of it. We studied the collaborative clustering algorithm based on minimum sum-squared residue, and then designed and realized the parallel collaborative clustering algorithm with MpReduce model. Experimental results show that the proposed parallel collaborative clustering algorithm can improve the efficiency of clustering, and be of well scalability.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机与现代化》
  • 中国科技核心期刊
  • 主管单位:江西省科学技术厅
  • 主办单位:江西省计算机学会 江西省计算技术研究所
  • 主编:刘波平
  • 地址:南昌市西湖区井冈山大道1416号8楼
  • 邮编:330003
  • 邮箱:jgsdd@163.com
  • 电话:0791-86490996
  • 国际标准刊号:ISSN:1006-2475
  • 国内统一刊号:ISSN:36-1137/TP
  • 邮发代号:44-121
  • 获奖情况:
  • 中国科技核心期刊 中国科技论文统计源期刊 江西省...
  • 国内外数据库收录:
  • 波兰哥白尼索引,中国中国科技核心期刊
  • 被引量:14808