位置:成果数据库 > 期刊 > 期刊详情页
存在级不确定数据上的概率Skyline计算
  • ISSN号:1000-1239
  • 期刊名称:《计算机研究与发展》
  • 时间:0
  • 分类:TP311.13[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]国防科学技术大学计算机学院,长沙410073, [2]94326部队自动化工作站,济南250000
  • 相关基金:国家“八六三”高技术研究发展计划基金项目(2007AA010502 2007AA01Z474 2006AA01Z451)
中文摘要:

概率Skyline计算是在不确定对象集合中找出Skyline概率大于给定阈值的对象,在多目标决策应用中有重要价值.现有的存在级不确定数据上的概率Skyline算法均需要预先建立索引,在数据量很大、维度很高或数据频繁更新时,建立索引往往不可行或者不会带来性能的提升,因此有必要设计通用的非索引算法.提出了存在级不确定数据上概率Skyline的首个非索引算法,用已扫描的数据动态地维护一个概率约束空间,未来落入该空间的对象可以被安全地裁剪.在标准的模拟数据集上维度不超过4时裁剪比率超过99.8%,相比不用裁剪规则的基本算法,查询时间节省50%以上.

英文摘要:

In recent years,many advanced technologies have been developed to collect and analyze massive data.In many cases,the data may contain errors or may be unreliable.Traditional methods often lead to unacceptable complexity when managing and mining these uncertain data,thus a lot of attention has been paid to the query evaluation on uncertain data.The probabilistic Skyline computation is to find the set of objects whose probabilities in skyline exceed a given threshold,which has a great value in multi-criteria optimization problem.Indices should be built in advance in existing algorithms.Building indices is frequently impracticable or not profitable when data has a high volume or large dimensionality or high update frequency,thus a non-indexed algorithm is necessary.In this paper,we propose the first non-indexing algorithm of probabilistic Skyline on existentially uncertain data.This algorithm dynamically maintains a probabilistic constrained space using objects scanned before.Future objects can be safely pruned if fall into that space.The algorithm is evaluated through extensive experiments on both real and benchmark synthetic data sets.It is shown that when the dimensionality is no more than 4 the pruning rate exceeds 99.8%,and the computation time is saved more than 50% over the nave algorithm.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机研究与发展》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院计算技术研究所
  • 主编:徐志伟
  • 地址:北京市科学院南路6号中科院计算所
  • 邮编:100190
  • 邮箱:crad@ict.ac.cn
  • 电话:010-62620696 62600350
  • 国际标准刊号:ISSN:1000-1239
  • 国内统一刊号:ISSN:11-1777/TP
  • 邮发代号:2-654
  • 获奖情况:
  • 2001-2007百种中国杰出学术期刊,2008中国精品科...,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,荷兰文摘与引文数据库,美国工程索引,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:40349