Web数据质量评估是Web数据管理的源头。为了对Web数据质量实现在线评估,提出对不确定性Web数据质量建模,从时间和空间范围内训练模型和提取信息,在线获取质量图谱。即对Web数据质量演化用随机过程模型刻画,根据训练的模型在线评估,从时间范围获取质量评估值;通过从不同网站的海量数据中融合和提取事实的完美表达,构建质量知识库,在线评估时将Web数据和事实的完美表达比对,从空间范围内获得质量评估值。本研究解决飞速膨胀的Web数据质量混乱的问题,是从根本上消除Web上"数据丰富、信息贫乏"的入手点,结合了数据库技术、数据挖掘、信息检索和机器学习的最新研究成果,具有较高的学术起点。其成果可以直接应用到信息检索、Web数据集成和电子政务等领域,产生直接效益。
英文主题词Web;data quality;uncertainty;quality profile;online assessment