位置:成果数据库 > 期刊 > 期刊详情页
分布式存储中的纠删码容错技术研究
  • ISSN号:0254-4164
  • 期刊名称:《计算机学报》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]国防科学技术大学并行与分布处理国家重点实验室,长沙410073, [2]国防科学技术大学计算机学院,长沙410073
  • 相关基金:国家自然科学基金(61379052); 国家重点研发计划项目(2016YFB1000101); 国家“八六三”高技术研究发展计划项目(2013AA01A213); 湖南省自然科学杰出青年基金项目(14JJ1026); 高等学校博士学科点专项科研基金资助课题(20124307110015)资助
中文摘要:

大数据规模上体量大和增长速度快的特点对存储系统的性能和可扩展性提出了严峻挑战.使用普通商用服务器构建的分布式存储系统服务能力强、成本低廉且极易扩展,在大数据的存储管理中得到了极为广泛的应用.分布式存储系统庞大的节点数量导致节点失效情况频发,必须采用一定的容错技术来保证数据可靠性.常用的容错技术主要包括多副本技术和纠删码技术两种.与多副本容错技术相比,纠删码容错技术能够以低得多的存储开销提供相同甚至更高的数据可靠性.随着近年来数据规模的爆炸式增长,纠删码容错技术受到了业界的广泛关注.该文综述了分布式存储中纠删码容错技术的研究现状.首先,介绍了纠删码容错技术的基本原理和概念,指出了纠删码容错技术在大规模分布式存储中面临的主要技术挑战;然后,从编码实现、纠删码设计、数据修复和数据更新等方面阐述了分布式存储中纠删码容错技术的研究进展,重点研究分析了各项关键技术的特点和局限性,并依据主要评价指标对现有纠删码的编码性能和修复性能进行了对比和分析;最后,基于最新研究动态指出了分布式存储中纠删容错技术未来的研究方向,包括同步编码实现技术、低冗余再生码设计和数据失效预测技术等.

英文摘要:

Storing and managing big data,whose volume is extremely large and keeps growing rapidly,is a big challenge.Distributed storage systems built from inexpensive commodity hardware,which are able to offer extremely high performance and high scalability with low economic cost,are widely used for storing and managing big data.However,the large amount of storage nodes in distributed storage systems makes node failures common in their daily operations.This makes it essential to introduce data redundancy so that data reliability is guaranteed.Replication and erasure coding are two common approaches used to protect data from node failures.Compared to replication,erasure coding incurs much lower storage overheads and can offer the same or even higher data reliability at the same time.For this reason,with the rapid growth of data,erasure coding has gained comprehensive attention recently.This paper summarizes the research status of erasure coding in distributed storage systems.Firstly,we introduce the basic idea and main concepts of erasure coding,and point out the main technical challenges of integrating erasure coding intolarge-scale distributed storage systems.Secondly,we provide a comparison and analysis of the latest research in the field from the aspects of data encoding technologies,design of erasure codes,data repair technologies,data update technologies and so on.We also provide a comprehensive comparison of common erasure codes from the aspects of data encoding and data repair.Finally,we point out some future work that can promote the further development of erasure coding in distributed storage systems,including synchronous data encoding,regenerating codes with low redundancy and data failure forecasting.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国计算机学会 中国科学院计算技术研究所
  • 主编:孙凝晖
  • 地址:北京中关村科学院南路6号
  • 邮编:100190
  • 邮箱:cjc@ict.ac.cn
  • 电话:010-62620695
  • 国际标准刊号:ISSN:0254-4164
  • 国内统一刊号:ISSN:11-1826/TP
  • 邮发代号:2-833
  • 获奖情况:
  • 中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 美国数学评论(网络版),荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:48433