位置:成果数据库 > 期刊 > 期刊详情页
GCPR:一种在MapReduce平台上基于图划分的PageRank加速方法
  • ISSN号:1000-1220
  • 期刊名称:《小型微型计算机系统》
  • 时间:0
  • 分类:TP301[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]复旦大学计算机科学技术学院,上海200433
  • 相关基金:国家科技重大专项项目(2010ZX01042-003-004)资助; 国家自然科学基金项目(61033010)资助; 国家“八六三”高技术研究发展计划重点基金项目(2009AA062803)资助; 上海市科委现代服务业专项基金项目(10dz1511000)资助
中文摘要:

随着应用的扩展,大规模图数据不断涌现,如何对拥有大量结点的图进行分析成为研究者关注的焦点问题之一.结点的海量性与分析的复杂性使得图分析任务需要借助MapReduce平台多机并行完成.在该平台上,现有的PageRank算法每轮迭代都须扫描、传输所有网页的完整状态,I/O和网络传输的开销严重影响了计算效率.为此,本文提出一种在MapReduce平台上基于图划分的PageRank加速方法:GCPR(Graph-clustering PageRank).GCPR利用图划分、数据两层压缩技术在MapReduce平台上进行PageRank迭代计算,不仅减少了Map到Reduce中间阶段I/O和网络传输的开销(MapReduce运算的主要瓶颈之一),而且平衡了计算资源.实验证明GCPR能极大提升MapReduce平台上的PageRank计算效率.

英文摘要:

As various applications spring up,the uses of large-scale graphs mushroom.How to analyze the graphs of abundant nodes draws the attention of researchers.The magnanimity of nodes and the complexity of the analysis make the task of analyzing the large-scale graphs resort to MapReduce for parallel computing on the distributed system.On MapReduce,the classical PageRank algorithm calls for scanning and transferring the entire state of the graph at each iteration.The cost of I/O and network transmitting increases the total time of computing.Given this problem,this paper proposes an algorithm with better efficiency for PageRank based on Graph-clustering on MapReduce: GCPR,which makes use of graph-clustering and twice compression.By means of GCPR,the cost of I/O and network transmitting between Map and Reduce(the major bottleneck of MapReduce) has been lessened and the computational resources have been balanced.Experiments demonstrate that GCPR could greatly enhance the computing efficiency of PageRank on MapReduce.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《小型微型计算机系统》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院沈阳计算技术研究所
  • 主编:林浒
  • 地址:沈阳市浑南新区南屏东路16号
  • 邮编:110168
  • 邮箱:xwjxt@sict.ac.cn
  • 电话:024-24696120 024-24696190-8870
  • 国际标准刊号:ISSN:1000-1220
  • 国内统一刊号:ISSN:21-1106/TP
  • 邮发代号:8-108
  • 获奖情况:
  • 中国自然科学核心期刊,中国科学引文数据库来源期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:23212