位置:成果数据库 > 期刊 > 期刊详情页
不确定数据库中基于x-tuple的高效Top-k查询处理算法
  • ISSN号:1000-1239
  • 期刊名称:计算机研究与发展
  • 时间:0
  • 页码:1415-1423
  • 语言:中文
  • 分类:TP311.13[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]江西财经大学信息管理学院,南昌330013, [2]江西省高校数据与知识工程重点实验室,南昌330013
  • 相关基金:国家自然科学基金项目(60803105 60763001); 国家社会科学基金项目(07BTQ025); 江西省教育厅科技重点基金项目(GJJ08508) 江西省教育厅科学技术研究重点基金项目(赣教技字[2007]435号)~~
  • 相关项目:基于隐式反馈和伪反馈的XML文本文档检索技术研究
中文摘要:

Top-k查询由于其广泛的应用而倍受欢迎.不确定数据库中通常考虑的两条生成规则是:独立和互斥,一个x-tuple是由一些互斥的元组组成的,构成一个x-tuple的各个元组称为该x-tuple的可选元组.U-kRanks查询考虑x-tuple中每个可选元组排在前k的概率,并返回最可能排在前k的k个元组.已有的Top-k语义都没有将x-tuple作为一个整体,因此,定义了一种新的Top-k查询语义,不确定x-kRanks查询(U-x-kRanks),该Top-k语义返回最可能排在前k的k个x-tuple而非元组.新语义考虑x-tuple中的每个可选元组位于前k的概率,并将之汇集,得到整个x-tuple位于前k的概率.提出了一种基于动态规划的有效算法处理U-x-kRanks查询,在最小的搜索空间内完成查询处理过程.不同数据集合上的综合实验显示,所提出的算法是高效的.

英文摘要:

Like top-k in traditional databases,top-k queries in uncertain databases are quite popular and useful due to its wide application usage.However,compared with top-k in traditional databases,queries over uncertain database are more complicated because of the existence of exponential possible worlds.Often,two kinds of generation rules are considered in the uncertain database:independent and mutually exclusive.An x-tuple is the union of the tuples mutually exclusive.U-kRanks queries consider each alternative in x-tuple as single one and return the tuple which has the highest probability appearing at top k or a given rank.However,no matter which alternative(tuple) of an x-tuple appears in a possible world,it is undoubtedly believed that this x-tuple appears in the same possible world accordingly.Thus,instead of ranking each individual tuple,the authors define a novel top-k query semantic in uncertain database,uncertain x-kRanks queries(U-x-kRanks),which return k x-tuples according to the score and the confidence of alternatives in x-tuples,respectively.In order to reduce the search space,they present an efficient algorithm to process U-x-kRanks queries,which can minimize the scan depth by terminating the scan process as soon as the answers are found.Comprehensive experiments on different data sets demonstrate the effectiveness of the proposed solutions.

同期刊论文项目
期刊论文 21 会议论文 15
期刊论文 33 会议论文 14 获奖 2 著作 1
同项目期刊论文
期刊信息
  • 《计算机研究与发展》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院计算技术研究所
  • 主编:徐志伟
  • 地址:北京市科学院南路6号中科院计算所
  • 邮编:100190
  • 邮箱:crad@ict.ac.cn
  • 电话:010-62620696 62600350
  • 国际标准刊号:ISSN:1000-1239
  • 国内统一刊号:ISSN:11-1777/TP
  • 邮发代号:2-654
  • 获奖情况:
  • 2001-2007百种中国杰出学术期刊,2008中国精品科...,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,荷兰文摘与引文数据库,美国工程索引,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:40349