近年来,各行业的信息量呈爆炸性增长趋势,一些科学应用中的数据量已经从几十个TeraBytes发展到PetaBytes并且在不断扩大。现有数据库管理系统无法提供TB/PB级海量数据有效的存储与查询支持。如何有效地存储、管理这些TB/PB级海量的数据集合,高效地支持各种复杂的查询是数据库领域面临的一个新的挑战性问题。为此,本课题从数据库系统的角度,研究基于云计算环境的TB/PB级海量数据查询处理的关键理论和技术,包括海量数据的存储与索引方法、海量数据的基本数据操作与复杂查询算法,以及查询优化与处理方法等,并研制相应的基于云计算环境的TB/PB级海量数据查询处理系统原型,验证课题所提出方法的正确性和有效性。
Cloud computing;TB/PB Level Massive;Query Processing;Query Optimization;
该课题在国内外率先开展了基于云计算环境的TB/PB 级海量数据查询处理的相关研究工作,提出了一些TB/PB 级海量数据查询处理的关键理论和技术,主要包括海量数据的存储与索引方法、海量数据的基本数据操作与复杂查询算法,以及查询优化与处理方法等,并研制了一个基于云计算环境的TB/PB 级海量数据查询处理系统原型用于验证算法的有效性和准确性。到目前为止,项目组已在国内外知名期刊和会议上发表学术论文16 篇(包括SCI索引的国际期刊5 篇,国际会议1 篇,国内一级期刊5 篇,国内会议5 篇),其中SCI 检索5 篇,EI 检索11篇。