网格技术已经开始进入实际应用,但是目前还缺乏用于网格信息检索的搜索引擎。未来网格中将有大量的存储在数据库中的数据,因此研究网格环境下的数据库信息检索新技术的时机已经到来。这项研究不仅具有技术前瞻性,而且也能推动其它领域内相关前沿问题的解决,它既是一项基础性的研究,也具有巨大的应用价值。我们的研究内容主要包括1)网格环境下的关系数据库关键词检索技术,主要创新包括给出一个高效通用的关系数据库关键词查询算法、提供统一的查询接口和支持查询数据库元数据及非字符列;2)网格环境下的分布式TOP-K查询技术,提出一种新的层次化的基于直方图的网格分布式Top-k查询算法;3)网格环境下分布式关键字索引技术,设计一种新的保持关键字顺序的可扩展分布式数据结构。除了提出这些创新性的技术和算法之外,我们还将在已有的网格标准的基础上建立一个原型系统并提供相应的网格服务,从而参与网格相关国际标准的制定。
数据库信息检索技术是数据库与信息检索的交叉研究领域,也是目前数据库领域研究的热点问题。我们研究网格、P2P等分布式环境下关系数据库关键词检索的技术和方法,从在线和离线、基于数据图/模式图、搜索算法、查询语言、性能优化、结果分类与展现等各方面对基于关键词查询的关系数据库信息检索新技术进行了全面深入研究。提出了基于数据图/模式图,以及混合的各种在线关系数据库关键词检索方法;提出了一系列性能优化方法;提出了一种新颖的基于离线索引的关系数据库关键词检索方法;提出了检索结果分类与展现新方法,查询结果融合,分布式Top-K查询算法。同时,我们开发了相应的原型系统,进行了大量的实验分析。项目研究成果在VLDB、ICDE、DASFAA、WAIM、WISE、KSEM数据库领域重要国际会议、J. Comput. Sci. & Technol. 、计算机学报、软件学报等期刊上发表学术论文近30篇,培养博士和硕士各6名。研究成果对于提高关系数据库易用性、丰富和发展关系数据库理论和技术、促进数据库与信息检索技术进一步融合、有效开发和利用信息资源将产生重要的社会效益和经济效益。总之,高质量超计划地完成了项目任务。