东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

不确定关系数据属性级溯源表示与概率计算

ISSN号：1000-9825
期刊名称：软件学报
时间：2014.4.1
页码：863-879
分类：TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
作者机构：[1]武汉大学计算机学院,湖北武汉430072, [2]武汉大学国际软件学院,湖北武汉430079
相关基金：国家自然科学基金（61232002,61202033）;国家高技术研究发展计划（863）（2012AA011004）;教育部博士点新教师基金（200804861067）;湖北省自然科学基金（2011CDB448）;武汉大学博士研究生自主科研基金（2012211020207）
相关项目：不确定性关系数据的溯源方法研究

关键词：不确定性, 属性表达式, 溯源表达式, 概率计算, 共享路径, uncertainty, attribute expression, lineage expression, probabilistic computation, share path

中文摘要：

传统的数据库应用中，数据往往被假定是精确可用的，而实际中数据普遍存在不确定性．以往许多利用溯源信息追踪数据不确定性的方法往往关注元组或单一属性存在不确定性的情况，通过对元组添加唯一变量标识，用变量标识所表示的溯源信息构造布尔表达式计算结果元组概率．当元组中多个属性存在不确定性时，对元组进行标识不能帮助用户快速而准确地找到造成不确定性的源属性值．定义属性表达式，并通过属性表达式构造溯源表达式．利用该溯源表达式不仅可以准确地追溯不确定性产生的具体位置，同时还可以实现结果元组的概率计算．为保证概率计算结果的正确性，提出溯源表达式的转换算法．通过分析影响结果元组概率计算效率的因素，还提出构建共享路径表的方法，在构建过程中对原子析取式进行预计算，以提高概率计算的效率．实验部分将该方法与现有的元组级溯源信息表示方法在时间代价和空间代价方面进行比较，验证其可行性和有效性．此外，实验部分还对利用共享路径加快结果元组概率计算的有效性进行了评估．

英文摘要：

In the traditional database applications, data is generally considered to be accurate and available. However, data uncertainty often occurs in the real world. Most of current methods usually use provenance information to track data uncertainty while placing focus on the uncertainty with tuple level rather than attribute level. Their main idea is to identify a tuple with a variable, and then construct Boolean expression based on provenance information to compute the probability of a tuple. For the tuple with lots of uncertain attributes, these methods can not help users rapidly and correctly identify the source of uncertainty. In this paper, attribute expressions are defined and used to construct the lineage expression for each result tuple. With the lineage expression, the new method can not only accurately traces the location where the uncertainty takes place, but also computes the probability of the result tuple. Meanwhile, the exchange algorithm of the lineage expression is proposed to guarantee the correctness of the probability computation. In order to improve the efficiency of the probability computation, a method is also provided to construct share paths, and compute the probability of atomic disjunctions during the period of constructing share paths. Experiments are performed to compare tuple level lineage expressions with the existing methods on both time and cost. The results show the feasibility and validity of the proposed method, and further verify the validity of utilizing share paths to speed up the probability computation.

同期刊论文项目

不确定性关系数据的溯源方法研究

期刊论文 8 会议论文 2

支持技术创新的海量数据管理基础理论与关键技术

期刊论文 38

同项目期刊论文

生物实验信息管理系统

对象代理数据库的虚属性查询优化方法

一种基于 k 近邻图的稀有类检测算法

Supporting Various Top-k Queries over Uncertain Datasets

一种基于k近邻图的稀有类检测算法？

一种面向团体的影响最大化方法

Attribute Level Lineage in Uncertain Data with Dependencies

生物实验信息管理系统

考虑观点多样性的评论选择问题

Mimir:一种基于密文的全文检索服务系统

Supporting Various Top-k Queries over Uncertain Datasets

支持通信数据查询分析的分布式计算系统

电子商务中的商品推荐系统

电子商务商品归一化方法研究

Product-oriented review summarization and scoring

基于概率图模型的互联网广告点击率预测

一种面向团体的影响最大化方法

基于分层抽样的重叠深网数据源选择

基于Top-k查询约束的深网增量爬取

基于立体视觉的监控视频人体目标跟踪

基于改进符号有向图模型的发动机引气系统多故障诊断方法

一种基于格的隐私保护聚类数据挖掘方法

基于用户邻域和主题的新颖性Web社区推荐方法

一种基于曝光量和点击率的用户组优化策略

分布式可扩展数据流连接算法

DBugHelper：分布式系统Debug协助工具

基于评论分析的评分预测与推荐

下一代移动推荐系统

基于业务持续性的航空公司机务维修安全评估

基于数据关联的分布式对象代理数据库划分方法

内存数据管理技术在族谱信息系统中的应用

支持技术创新的专利检索与分析

云键—值数据仓库的并行数据集成方法研究

一种改进的动态帧时隙ALOHA算法

专利检索与分析研究综述

A Patent Hotspot Discovery Method

Attribute Level Lineage in Uncertain Data with Dependencies

基于灰色动态马尔科夫的航班延误预测

CDM机制下基于多航站楼运行模式的机场停机位实时分配算法

Remaining useful life prognostics for aeroengine based on superstatistics and information fusion

分布式数据流上的高性能分发策略

期刊信息

《软件学报》
北大核心期刊（2011版）

主管单位:中国科学院
主办单位:中国科学院软件研究所中国计算机学会
主编：赵琛
地址：北京8718信箱中国科学院软件研究所
邮编：100190
邮箱：jos@iscas.ac.cn
电话：010-62562563

国际标准刊号：ISSN：1000-9825
国内统一刊号：ISSN：11-2560/TP
邮发代号:82-367

获奖情况:
2001年入选中国期刊方阵“双百期刊”,2000年荣获中国科学院优秀科技期刊一等奖

国内外数据库收录:
俄罗斯文摘杂志,美国数学评论（网络版）,波兰哥白尼索引,德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:54609