位置:立项数据库 > 立项详情页
适合并行系统结构的存储系统多容错编码设计及其算法优化
  • 项目名称:适合并行系统结构的存储系统多容错编码设计及其算法优化
  • 项目类别:青年科学基金项目
  • 批准号:60903028
  • 申请代码:F020403
  • 项目来源:国家自然科学基金
  • 研究期限:2010-01-01-2012-12-31
  • 项目负责人:王刚
  • 负责人职称:教授
  • 依托单位:南开大学
  • 批准年度:2009
中文摘要:

海量信息存储一直是计算机科学最重要的领域之一。近年来,由于突发灾难事件时有发生,人们对数据保护技术越来越重视。容错编码技术是基础的数据保护技术之一,当前应用需求的推动和存储技术自身发展的趋势,对多容错编码提出了迫切的需求。但现有多容错编码中还没有公认的完美的方案,而性能优化的研究就更为滞后。因此,本项目拟利用组合数学方法改进现有多容错阵列码的不足、设计新的高容错阵列码和多级混合码方案;设计非MDS阵列码和解码性能最优的阵列码方案;针对现代多核/众核体系结构,优化编码方案,深度优化、并行化编码/解码算法;设计编码方案按需选择算法,实现编码/解码算法库,验证编码方案和算法在实际存储系统中的表现。这些研究内容符合国内外学术界最新研究趋势,有望取得在国内外学术界有一定影响力的成果。并与国内兄弟院校、科研机构及IT企业的工作形成互补,为我国存储技术研究和产业化起到一定促进作用。

结论摘要:

随着计算机技术的迅猛发展,以及信息量的爆炸式增长,人们对存储系统可靠性的要求越来越高。而编码作为提高系统可靠性的一种重要方法,在工业界和学术界,都得到了广泛的研究和应用。本课题针对大规模并行存储系统的应用场景,研究多容错编码的设计与优化,取得了一系列的成果,具体贡献如下 1) 提出了一个多容错阵列码的形式化定义,为编码设计和优化建立了数学基础。 在国际学术界首先发现了拉丁方、NRB等组合模型与阵列码之间的联系,定义了一种基于区组设计的多容错阵列码形式化描述,为相关研究建立了数学基础。 2) 提出了一种利用拉丁方、NRB等组合模型设计多容错阵列码的普适性方法。 用于推广多种经典多容错阵列码,提高了灵活性、多样性,降低了计算复杂度,为存储编码的研究提供了一种新的途径。 3) 提出了一系列利用组合方法优化编码/数据布局的方法。 提出了两种构造非MDS码的思路,构造的编码方案具有局部性好、按需选择编码能力、零开销逐级扩展、非对称性等适合分布式存储环境的优点。提出了一种非MDS码可靠性定量分析方法。这些研究充分体现了组合描述对阵列码相关研究的指导作用。 4) 设计了一套适合不同硬件平台和系统规模的高效编码/解码算法,充分发挥从单CPU至GPU再至集群不同规模平台的并行能力。 5) 提出了一个以编码为核心,以按需分配卷为存储基础的多维数据保护体系。 实现了多种数据保护技术的有机融合,具有存储空间按需分配、统一框架下的多种数据保护、低功耗等适合云存储需求的特点。 6) 将组合数学、数据存储和并行处理等成果推广到相关领域,取得了较为突出的成果。 将组合数学方法、存储容错和并行处理技术的成果应用于广域网存储和信息检索、搜索引擎数据存储和处理、生物信息学等领域,取得了提出成果,表明在项目实施过程中的技术积累具有基础性、普遍性,可广泛应用于相关领域。 课题组在完成科研任务的基础上,产出了较为丰富的科成果,共发表论文43篇,其中SCI检索3篇,EI检索28篇,ISTP检索14篇;并有CCF推荐A类期刊/会议论文2篇,B类论文4篇,C类论文6篇。完成博士学位论文3篇,硕士学位论文16篇。获得授权发明专利2项,软件著作权4项,成果转化2项。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 15
  • 26
  • 0
  • 0
  • 0
会议论文
相关项目
期刊论文 11 会议论文 4 专利 10
期刊论文 5 会议论文 2 获奖 4
期刊论文 27 会议论文 4 著作 2
期刊论文 28 会议论文 20
王刚的项目