位置:成果数据库 > 期刊 > 期刊详情页
基于副本分布策略的MapReduce性能优化技术
  • ISSN号:1006-3080
  • 期刊名称:《华东理工大学学报:自然科学版》
  • 时间:0
  • 分类:TP302.7[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]华东理工大学计算机科学与工程系,上海200237, [2]上海市计算机软件评测重点实验室,上海201112
  • 相关基金:国家自然科学基金(61173048)
中文摘要:

摘要:集群中的节点由于其硬件配置不同导致其性能不同,使得集群环境成为异构环境。然而,在以Hadoop为代表的MapReduce实现中并没有充分考虑到环境的异构性,致使过多的Map任务需要从其他节点传输输入数据块,从而影响MapReduce在异构环境中的性能。提出了一种基于节点性能的数据块副本分布策略,使副本的分布与节点性能相适应,同时将可靠性、创建的传输开销及数据块间性能的平衡纳入考虑。结果表明:该策略在异构环境中能有效提升输入数据在本地的Map任务比例,并缩短MapReduce任务的完成时间。

英文摘要:

In heterogeneous environments, the nodes in a cluster have different performances due to their various hardware configurations. It is known that the Hadoop, the most widely used MapReduce implementation, does not sufficiently take heterogeneous environments into consideration. Moreover, in heterogeneous environments, many map tasks are not data-local such that the severe performance degradation. A novel replica placement strategy is proposed, which is based on the performance of nodes. The replica placement strategy also takes reliability, the overhead of replicas creation, and the performance balance between data blocks into account. Results show that the proportion of data-local map tasks is increased and the response time of MapReduce jobs is decreased effectively by using the proposed replica placement.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《华东理工大学学报:自然科学版》
  • 北大核心期刊(2011版)
  • 主管单位:教育部
  • 主办单位:华东理工大学
  • 主编:刘红来
  • 地址:上海梅陇路130号
  • 邮编:200237
  • 邮箱:ecustxbbzz@ecust.edu.cn
  • 电话:021-64252666
  • 国际标准刊号:ISSN:1006-3080
  • 国内统一刊号:ISSN:31-1691/TQ
  • 邮发代号:4-382
  • 获奖情况:
  • 2001年被国家新闻出版总署评为"中国期刊方阵科技...,2002年获"第五届全国石油和化工行业优秀期刊二等奖",2004年获"全国高校优秀科技期刊二等奖",2006年荣获"首届中国高校优秀科技期刊奖"以及"第...
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:10083