本课题研究面向概率数据流的聚集查询处理技术,该技术在交通管理、物流分析、网络监控等应用中意义重大。本课题主要存在两大挑战。一是可能世界实例的数量会随着数据规模呈指数形式递增,二是数据流上的元组高速到达,数据规模宏大却要求满足较低的空间复杂度和时间复杂度。在项目执行期间,课题组成员围绕预先制定的研究方案努力工作,设计了多种创新技术手段来管理top-k查询、关键属性查询、kNN查询、聚类分析、复杂聚集查询等多项任务,部分成果已经达到本研究领域的国际级水平。所取得的主要学术成果包括(1)共发表论文、书、专利等20篇(项),其中3篇被SCI收录,9篇被EI收录,超出预定目标;(2)一篇论文在VLDB Journal(计算机领域的顶级刊物)发表,这是内地科研单位首次在该刊物上发表第一单位研究论文;(3)一篇论文荣获APWEB/WAIM 2009国际会议的Best Student Paper Award;(4)一篇论文荣获WAIM 2011国际会议的Best Paper Run-up Award。课题组严格按照基金委的要求使用经费。
英文主题词probabilistic stream; aggregate query; achieve the goal