东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

MapReduce集群环境下的数据放置策略

ISSN号：1000-9825
期刊名称：《软件学报》
时间：0
分类：TP316[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
作者机构：[1]太原科技大学计算机科学与技术学院,山西太原030024, [2]Department of Computer Science and Software Engineering, Auburn University, USA
相关基金：国家自然科学基金（61272263）;NSF CAREER Award（CCF-0845257）

关键词：数据放置, MAPREDUCE, 编程模型, 能耗, 负载均衡, data placement, MapReduce, programming model, energy-efficient, load balancing

中文摘要：

MapReduce是一种适用于大规模数据密集型应用的有效编程模型，具有编程简单、易于扩展、容错性好等特点，已在并行和分布式计算领域得到了广泛且成功的应用．由于MapReduce将计算扩展到大规模的机器集群上，处理数据的合理放置成为影响MapReduce集群系统性能（包括能耗、资源利用率、通信和I／O代价、响应时间、系统的可靠性和吞吐率等）的关键因素之一．首先，对MapReduce编程模型的典型实现——HadooD缺省的数据放置策略进行分析，并进一步讨论了MapReduce框架下，设计数据放置策略时需考虑的关键问题和衡量数据放置策略的标准；其次，对目前MapReduce集群环境下的数据放置策略优化方法的研究与进展进行了综述和分析：最后，分析和归纳了MapReduce集群环境下数据放置策略的下一步研究工作．

英文摘要：

As an effective programming model for large-scale data-intensive applications, MapReduce has been widely and successfully applied in the field of parallel and distributed computing, and has the characteristics of good fault-tolerance and easy to implement and extend. Because MapReduce extends computing to the nodes of large-scale cluster system, reasonable placement of processing data has become one of the key factors affecting the performance of MapReduee cluster system, including energy efficiency, resource utilization, communications and I/0 throughput, response time, and reliability. This study first analyzes characteristics of the default data placement strategy of Hadoop, which is a typical implementation of MapReduce programming model. Next, it investigates popular data placement strategies for MapReduce cluster computing environments. Finally, it presents future research directions in the area of data placement strategies for MapReduce-based cluster computing systems.

同期刊论文项目

海量高维天体光谱数据挖掘及其并行化研究

期刊论文 5

同项目期刊论文

相关子空间中的局部离群数据挖掘算法研究

基于MapReduce与相关子空间的局部离群数据挖掘算法

LAMOST离群光谱J140242.45＋092049.8特征分析

一种晚型天体光谱离群数据挖掘系统

期刊信息

《软件学报》
北大核心期刊（2011版）

主管单位:中国科学院
主办单位:中国科学院软件研究所中国计算机学会
主编：赵琛
地址：北京8718信箱中国科学院软件研究所
邮编：100190
邮箱：jos@iscas.ac.cn
电话：010-62562563

国际标准刊号：ISSN：1000-9825
国内统一刊号：ISSN：11-2560/TP
邮发代号:82-367

获奖情况:
2001年入选中国期刊方阵“双百期刊”,2000年荣获中国科学院优秀科技期刊一等奖

国内外数据库收录:
俄罗斯文摘杂志,美国数学评论（网络版）,波兰哥白尼索引,德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:54609