随着数据采集和传输技术的发展,传统数据库技术难以满足各种应用的要求,不确定性数据管理成为了研究的热点。世系分析是指基于数据产生和演变的过程来跟踪数据不确定性的来源,是不确定性数据管理的关键技术之一。不确定性数据世系分析的研究目前主要集中在世系概率计算方面,支持概率推演的有效世系表示和高效处理技术是亟待解决的问题。本项目主要针对世系概率推演查询,以不确定性数据的查询计划为出发点,研究基于贝叶斯网的世系表示、基于关系数据库的世系存储方法,基于关系操作、概率推理及相应优化策略的高效世系查询处理技术;对新方法进行理论分析及实验测试,并和现有技术进行比较。相关研究成果将为世系分析提供新的解决思路,为不确定性数据的查询优化和质量保证等问题提供有效的支持,并能提升不确定性数据管理系统的处理能力,具有重要的理论意义和应用价值。预期在国内外重要期刊及会议上发表论文12篇,开发不确定性数据世系分析的原型系统。
Uncertain data;Lineage analysis;Bayesian network;Query processing;Probabilistic inference
通过对项目中关键问题的深入研究,取得了不确定性数据世系分析的阶段性研究结果,对照项目申请书和计划任务书,已按期完成了预期的目标和任务。在理论方法与支撑技术方面,提出了以贝叶斯网为理论基础和知识框架的不确定性数据世系表示方法、以及对模型进行修正的策略,以贝叶斯网概率推理为核心的不确定性数据世系查询处理技术,将模型构建与概率推理查询技术用于几类典型不确定性数据分析中的支撑技术,面向高效世系分析的优化方法。通过理论分析和实验测试,验证了方法的高效性、正确性和可用性;同时也针对实际中典型的不确定性数据,提出了用于世系分析的技术方案,设计并开发了相应的软件系统。 作为这些研究结果的体现,本项目资助发表了28篇学术论文(其中SCI收录7篇,EI收录及源刊21篇次,ISTP收录及源刊10篇次),申请发明专利2项(其中授权1项,公开且进入实质审查1项),申请获得计算机软件著作权登记4项,出版专著1部。依托于本项目的研究,主办国际学术活动1次,培养青年教师3名、博士生3名、硕士生8名。