东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

适应节能与异构环境的MapReduce数据布局策略

ISSN号：0529-6579
期刊名称：中山大学学报(自然科学版)
时间：2015.11.15
页码：55-66
分类：TP393.09[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]新疆财经大学统计与信息学院,新疆乌鲁木齐830012, [2]新疆大学软件学院,新疆乌鲁木齐830008, [3]新疆医科大学医学工程技术学院,新疆乌鲁木齐830011, [4]清华大学软件学院,北京100084
相关基金：国家自然科学基金资助项目（61562078,61262088,71261025）; 新疆财经大学博士启动基金资助项目（2015BS007）
相关项目：基于空间时频分量的信息隐藏与获取关键技术研究

关键词：绿色计算, MAPREDUCE, 异构环境, 数据布局, green computing, MapReduce, heterogeneous environment, data layout

中文摘要：

大数据处理过程中产生的高能耗问题亟待解决,尤其是在数据量规模剧增的背景下。在对已有数据布局策略存在问题分析的基础上,分析了与基于存储区域划分的节能模式及与异构HDFS集群的不适应、数据块切分算法不灵活、存储节点选择的随机性等几个方面的问题,继而提出面向节能的MapReduce数据布局策略。首先,新策略适应将集群划分为不同存储区域（Active-Zone与Sleep-Zone）的节能模式;其次,新策略对传统的数据块数计算方法进行了改进,提出作业截止时间约束下的最小任务数计算方法确定数据块数量;最后,新的存储策略增加了对异构集群环境的适应能力,并能根据不同的作业类型进行存储节点的选择。实验结果表明：新的数据布局策略能够适应异构集群环境,达到减小MapReduce作业能耗的目的。

英文摘要：

The problem of high energy consumption producing from big data processing is an important issue that needs to be solved,especially under the background of data explosion. Based on analyzing problems of the existing data layout policy,the problems of the in adaptation of energy-saving mode based on storage area division and heterogeneous HDFS cluster,the inflexibility of data block segmentation algorithm,the randomness of storage node selection,proposing a data layout strategy orienting to energy conservation are analyzed. Firstly,the new strategy divides the cluster into two different storage areas to meet the needs of saving energy： Active-Zone and Sleep-Zone; secondly,the new strategy has made im-provements on traditional data block computing method,proposes a minimum number of jobs calculation method to determine the number of data blocks; at last,the new strategy can increase the adaptability of the heterogeneous cluster environment and can choose the appropriate storage nodes according to different job types. Experimental results show that the new data layout strategy can adapt to the heterogeneous cluster environment and reach the goal of reducing energy consumption for MapReduce jobs.

同期刊论文项目

基于空间时频分量的信息隐藏与获取关键技术研究

期刊论文 80 会议论文 5 获奖 1

基于网络社群的网络舆情演化分析及突发事件预警机制研究

期刊论文 14

多Slot环境下的MapReduce能耗模型及优化研究

期刊论文 10

云计算环境下应用数据层节能计算研究

期刊论文 44

同项目期刊论文

Experimental stutdy of dynamic single-source shortest path algorithm

A Reduced-Complexity Sphere Decoding Algorithm for MIMO Systems

A Novel Blind Source Extration Method For EP Signals

Analysis of Watermark Capacity and Robustness Under Unintentional and Steganalysis Attacks

浅析分布式学习下智能授导系统的构建策略

现代无线通信技术对智能授导系统的影响分析

Well-posedness for a Class of Variational–Hemivariational Inequalities with Perturbations

Effect of Heterogeneity of Vertex Activation on Epidemic Spreading in Temporal Networks

以就业为导向财经类院校计算机专业人才培养研究

Color image encryption using skew tent map and hyper chaotic system of 6th-order CNN

基于DWT-SVD的音频零水印算法

RGB空间平均颜色矢量法在颜色识别中的研究

小波域欠定盲图像混合矩阵估计研究

一种时频域加权张量分解的欠定盲源分离方法

并行Fp-growth算法在搜索引擎中的应用

基于可变权值的动态最短路径算法

基于频域相位方差加权的线性调频信号检测方法

基于覆盖粗糙集的语言动力系统

不同覆盖产生相同覆盖近似集的条件研究

一种新的覆盖粗糙模糊集模型

覆盖Vague集

新兴技术未来产业影响力之作用机理研究

基于专利的新兴技术未来产业影响力评价研究

稀疏形式下的区块式快速指数运算算法

温度感知的MapReduce节能任务调度策略

基于GPU的并行奇异值分解最小平方估计算法

分布式奇异值分解最小平方估计算法

考试数据分析及孤立点检测的谱聚类方法

基于聚类分析的锚测验等值样本选取方法研究

基于SVD的谱聚类算法在维吾尔语水平测试数据分析中的应用

An Immunization Strategy Based on Propagation Mechanism

基于动态频谱博弈约束机制的认知无线网络信道选择算法

基于RDWT-DCT-SVD的鲁棒性音频盲水印算法

彩色图像分割算法研究

基于邻居节点平均度的级联故障袭击策略研究

基于线上线下网络的舆情传播模型研究

一种基于O-RA代数的服务自组合可视化方法

认知无线电中基于多址接入信道的多用户联合频谱感知算法

无线光接入网中光源阵列简化的适用性分析

免疫传播抑制病毒的蔓延

基于多链路权值减小的动态SPT算法研究

复杂网络中基于wcc的并行可扩展社团挖掘算法

基于维哈柯文非安全文档识别的哈希数据库系统设计

物流网络级联失效下的抗毁性分析

温度感知的MapReduce节能任务调度策略

基于Spark的ItemBased推荐算法性能优化

大数据流式计算环境下的阈值调控节能策略

SparkDAG优化MapReduce协同过滤算法

基于Spark的MapReduce相似度计算效率优化

基于分配适应度的Spark渐进填充分区映射算法

大数据流式计算环境下的内存节能策略

基于聚类层次模型的视频推荐算法

基于GraphX的传球网络构建及分析研究

稀疏形式下的区块式快速指数运算算法

温度感知的MapReduce节能任务调度策略

分布式奇异值分解最小平方估计算法

基于Spark的MapReduce相似度计算效率优化

基于GraphX的传球网络构建及分析研究

面向网络舆情的哈萨克语情感词汇自动获取

面向舆情主题的微博用户网络影响力挖掘分析

暴恐主题下微博用户特征及情感倾向性分析

面向舆情主题的微博用户行为聚类实证分析

基于CRFs的哈萨克语名词短语自动获取

基于超网络的舆情信息传播机制分析

网络社群的舆情演化机制分析

大数据时代网络舆情信息集成机制研究

温度感知的MapReduce节能任务调度策略

云计算环境下多有向无环图工作流的节能调度算法

一种适应节能的云存储系统元数据动态建模与管理方法

P2P下基于RSA密码机制和门限秘密共享的信誉管理方案

新疆典型荒漠草地的高光谱特征提取和分析研究

融合奇异性和扩散过程的协同过滤模型

评分可信度条件下的协同过滤模型

基于Spark的ItemBased推荐算法性能优化

SparkDAG优化MapReduce协同过滤算法

基于Spark的MapReduce相似度计算效率优化

基于分配适应度的Spark渐进填充分区映射算法

大数据流式计算环境下的内存节能策略

基于聚类层次模型的视频推荐算法

基于GraphX的传球网络构建及分析研究

基于信任模型填充的协同过滤推荐模型

新疆阜康荒漠植被指数特征和时空过程分析

基于内存云架构的带宽负载均衡算法

基于可靠性的云工作流调度策略

一种面向低延迟的内存HDFS数据存储策略

基于内存云的大块数据对象并行存取策略

适应异构集群的Mesos多资源调度DRF增强算法

面向内存云的数据块索引方法

基于复杂网络节点重要性的链路预测算法

基于迭代填充的内存计算框架分区映射算法

分布式文件系统数据块聚类存储节能策略

面向内存云的协调器选举策略

结构化查询语言动态功耗解析及建模

内存云分级存储架构下的数据迁移模型

融合评论分析和隐语义模型的视频推荐算法

内存计算框架局部数据优先拉取策略

云环境下能耗感知的虚拟机动态迁移策略研究

融合可信度和时效标签的商品推荐算法

结合评分可信度和动态时间加权的推荐算法

基于LDA主题模型的移动应用相似度构建方法

基于负载感知的数据流动态负载均衡策略

基于标签匹配的协同过滤推荐算法研究

基于快速构建模板的购物信息抽取方法

并行计算框架Spark的自适应缓存管理策略

基于SpringMVC和Hibernate的企业人事管理系统

云环境基于多工作流的任务调度节能算法的研究

一种分区BP人工神经网络图像差值算法

An Operator on Ascent Sequences

一种多 DAG 任务共享异构资源调度的费用优化方法

期刊信息

《中山大学学报：自然科学版》
北大核心期刊（2011版）

主管单位:国家教育部
主办单位:中山大学
主编：王建华
地址：广州市新港西路135号
邮编：510275
邮箱：xuebaozr@mail.sysn.edu.cn
电话：020-84111990

国际标准刊号：ISSN：0529-6579
国内统一刊号：ISSN：44-1241/N
邮发代号:46-15

获奖情况:
全国优秀高等学校自然科学学报及教育部优秀科技期...,广东省优秀科学技术期刊一等奖,《中文核心期刊要目总览》综合性科技类核心期刊,中国期刊方阵“双效”期刊

国内外数据库收录:
美国化学文摘（网络版）,美国数学评论（网络版）,英国农业与生物科学研究中心文摘,德国数学文摘,荷兰文摘与引文数据库,美国剑桥科学文摘,英国动物学记录,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,英国英国皇家化学学会文摘,中国北大核心期刊（2000版）

被引量:18509