东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

基于分布式文件系统HDFS的节能算法

ISSN号：0254-4164
期刊名称：计算机学报
时间：2013.5.5
页码：1047-1064
分类：TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
作者机构：[1]新疆大学软件学院,乌鲁木齐830008, [2]新疆大学信息科学与工程学院,乌鲁木齐830046
相关基金：本课题得到国家自然科学基金（60863003,61063042）和新疆维吾尔族自治区自然科学基金（2011211A011）资助.
相关项目：云计算环境下多用户工作流的研究

关键词：云计算, 分布式文件系统, 节能计算, 副本策略, 绿色计算, cloud computing, distributed file system, energy-efficient computing, replica placement strategy, green computing

中文摘要：

与传统数据中心节能算法不同，MapReduce计算任务的数据依赖性使得设计HDFS（HadoopDistributedFileSystem）节能算法时必须保证集群中所有数据块的可用性，即任意数据块或其副本中的至少一块处于活动状态．根据HDFS集群结构与数据块存储等特点建立了DataNode节点矩阵、节点状态矩阵、文件分块矩阵、数据块存储矩阵与数据块状态矩阵，为后续研究建立了基础模型．结合数据块状态矩阵与数据块可用性之间的关系设计了DataNode节点休眠验证算法．概率分析了由于机架感知的存储策略带来数据块分布的随机性，使得在不改变数据块存储结构与存储策略的情况下并不能通过休眠DataNode节点达到节能的目的．进而设计了数据块存储结构配置节能算法与基于对称数据块存储策略下的节能算法，分别从改变数据块的存储结构与存储策略两方面对HDFS进行节能改进．实验结果表明：两种节能算法都能解决HDFS集群的能耗低利用率问题，并且集群负载越低节能效率越高．

英文摘要：

Different from traditional energy-efficiency algorithms in data center, data-dependent computing mechanism of MapReduee makes energy-efficiency algorithm in HDFS （Hadoop Dis- tributed File System） must ensure the availability of all data blocks in cluster, that means at least one data block or its replica should in active state. DataNode matrix, DataNode status matrix, file block matrix, block storage matrix and block status matrix are created based on the HDFS cluster structure and block storage mechanism etc. , and those matrixes established foundational models for further research. Based on the relationship between the availability of data blocks and its block status matrix, algorithm for make sure if a DataNode can sleep is designed. Probability analysis makes out that it is difficult to save energy in HDFS cluster without changing the data block＇s storage structure or replica placement mechanism because randomness distribution of the data block result from rack-awareness replica placement mechanism. So we design data block storage structure configuration energy-efficiency algorithm and energy-efficiency algorithm under symmetric replica placement mechanism to save the energy consumption of the HDFS cluster from changing and improving of block＇s storage structure and replica placement mechanism respectively. Mathematical analysis and experiments prove that two energy-efficiency algorithm solve HDFS cluster＇s high energy consumption but low-efficiency problem, the lower utilization of the cluster the more energy consumption it can save.

同期刊论文项目

非贡献网格服务资源环境下网格工作流的研究

期刊论文 50 会议论文 12 获奖 1

云计算环境下多用户工作流的研究

期刊论文 42 会议论文 2

同项目期刊论文

基于P2P的分布式文件系统下载效率优化

Verifiable Storage Structure for Reputation in P2P Networks

异构分布式环境下多DAG 工作流的混合调度策略

基于动态等待时间阈值的延迟调度算法

基于最小化传输和完成时间的多DAG调度

基于可用性度量的分布式文件系统节点失效恢复算法

云计算环境下多有向无环图工作流的节能调度算法

一种适应节能的云存储系统元数据动态建模与管理方法

P2P下基于RSA密码机制和门限秘密共享的信誉管理方案

基于存储结构重配置的分布式存储系统节能算法

新疆典型荒漠草地的高光谱特征提取和分析研究

基于决策树的典型荒漠草地遥感分类策略

云计算环境下科学工作流两阶段任务调度策略

一种简化的BP神经网络图像插值算法

云计算环境下软硬件节能和负载均衡策略

综合用户和项目预测的协同过滤模型

考虑项目属性的协同过滤推荐系统

云计算环境下基于信任模型的动态级访问控制

云计算环境下能量感知的任务调度算法

云计算下基于信任的防御系统模型

基于改进粒子群算法的云计算任务调度算法

高可信容错计算机系统设计与应用研究

融合奇异性和扩散过程的协同过滤模型

评分可信度条件下的协同过滤模型

基于信任模型填充的协同过滤推荐模型

三维DTN网络中基于位置的功率感知路由算法

新疆阜康荒漠植被指数特征和时空过程分析

基于内存云架构的带宽负载均衡算法

基于可靠性的云工作流调度策略

云计算环境下基于用户满意度的遗传算法

一种基于帧内压缩的视频实时传输方法

有期限约束的多DAG共享资源的调度及公平费用优化方法

异构分布式环境下多DAG工作流的混合调度策略

一种面向低延迟的内存HDFS数据存储策略

An Operator on Ascent Sequences

安全可控的SDN技术研究

网络弹性技术研究

Linux环境下NAT服务与安全研究

基于龙芯处理器的自主可信计算机研究

增强安全隐匿网格系统的研究(英文)

自管理机密网络的分布式匿名路由协议

基于非贡献网格的自适应任务调度算法研究

基于多维QoS约束的网格任务调度算法

基于贪心策略的网格工作流费用优化算法

基于负载均衡的任务调度改进算法

基于关键决策方法的站内搜索研究与实现

网格环境中基于负载均衡的工作流调度算法

可信网络中基于信誉和风险评估的动态信任模型

网格环境下基于模糊筛选的自由资源选择方法

在线课程下的自适应查询调度算法

网格工作流的动态贪心调度算法

Analogy-based immune model and the application

JXTA网络中发布Web服务的关键技术探讨

基于资源状态可靠度的网格工作流调度算法

基于排队论时间预测的网格工作流调度算法

A resource allocating algorithm in grid workflow based on critical regions reliability

A novel fusion method for semantic concept classification in video

基于网格资源预测的任务优先级调度算法

基于竞争机制的网格资源分配方法

资源灰预测的反馈任务调度算法

基于Hierarchy与社会关系的网格资源发现算法研究

信任驱动的网格调度算法

基于P2P网络的Web服务发布模型研究

基于状态预测的网格工作流资源选择策略

用户QoS及系统指标指导的计算网格任务调度

基于关键区间可靠度的网格工作流资源分配算法

Towards critical region reliability support for Grid workflows

基于动态等待时间阈值的延迟调度算法

一种适应节能的云存储系统元数据动态建模与管理方法

云计算环境下基于信任模型的动态级访问控制

云计算环境下能量感知的任务调度算法

基于改进粒子群算法的云计算任务调度算法

基于可靠性的云工作流调度策略

云计算环境下基于用户满意度的遗传算法

异构分布式环境下多DAG工作流的混合调度策略

抗分割的移动传感器网络自部署算法

基于Petri网的对等资源访问控制协议仿真

基于Petri网的Web服务组合分析方法

BP-ANN在荒漠草地高光谱分类研究中的应用

基于小区域约束的激光网络特定节点检测技术

期刊信息

《计算机学报》
北大核心期刊（2011版）

主管单位:中国科学院
主办单位:中国计算机学会中国科学院计算技术研究所
主编：孙凝晖
地址：北京中关村科学院南路6号
邮编：100190
邮箱：cjc@ict.ac.cn
电话：010-62620695

国际标准刊号：ISSN：0254-4164
国内统一刊号：ISSN：11-1826/TP
邮发代号:2-833

获奖情况:
中国期刊方阵“双效”期刊

国内外数据库收录:
美国数学评论（网络版）,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:48433