位置:成果数据库 > 期刊 > 期刊详情页
异构Hadoop集群下自适应平衡数据存储的大数据放置策略
  • ISSN号:1004-373X
  • 期刊名称:《现代电子技术》
  • 时间:0
  • 分类:TN915.34[电子电信—通信与信息系统;电子电信—信息与通信工程] TP393[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]周口师范学院网络工程学院,河南周口466001, [2]周口师范学院计算机科学与技术学院,河南周口466001, [3]大连理工大学计算机科学与技术学院,辽宁大连116024
  • 相关基金:河南省科技厅软科学研究计划项目(142400411213); 河南省高等学校重点科研项目(15A520118); 河南省教育厅科技重点项目(14B520014)
中文摘要:

Hadoop是一种处理和存储大数据的平台,针对异构Hadoop集群下采用均等数据分配方法易降低系统计算性能的问题,提出一种自适应平衡数据存储的大数据放置策略。根据异构集群中各节点的计算能力比例,将数据分配到节点中。在任务处理过程中,根据反馈的任务完成时间信息,动态更新节点的能力比例,自适应调整数据分配,从而使异构Hadoop集群中各节点处理数据的时间大致相同,降低节点之间的数据移动量,提高了节点利用率。实验结果表明,该策略能够有效缩减任务完成时间,提高了系统的整体性能。

英文摘要:

Hadoop is a platform for processing and storage of big data. A big data placement strategy for adaptive balance data storage in heterogeneous Hadoop cluster is proposed to solve the issue that equal data placement in heterogeneous Hadoop cluster will debase the calculation performance of the system. The data is placed into nodes according to the computing capacity ratio of each node in heterogeneous cluster. In the process of task processing,the node ratio is updated dynamically according to the feedback information of task completion time,and then the adaptive adjustment of data distribution is conducted,so that the time that every node in heterogeneous Hadoop cluster processes the data is basically same,the amount of data transfer between nodes is reduced,and the utilization of nodes is improved. The experimental results show that the proposed strategy can effectively reduce the task completion time and improve the overall performance of the system.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《现代电子技术》
  • 北大核心期刊(2014版)
  • 主管单位:陕西省信息产业厅
  • 主办单位:陕西电子杂志社 陕西省电子技术研究所
  • 主编:张郁(执行)
  • 地址:西安市金花北路176号陕西省电子技术研究所科研生产大楼六层
  • 邮编:710032
  • 邮箱:met@xddz.com.cn
  • 电话:029-93228979
  • 国际标准刊号:ISSN:1004-373X
  • 国内统一刊号:ISSN:61-1224/TN
  • 邮发代号:52-126
  • 获奖情况:
  • 中国科技核心期刊
  • 国内外数据库收录:
  • 波兰哥白尼索引,中国中国科技核心期刊,中国北大核心期刊(2014版)
  • 被引量:37245