位置:成果数据库 > 期刊 > 期刊详情页
支持起源回溯的最小化标识属性传播
  • ISSN号:1672-9722
  • 期刊名称:计算机与数字工程
  • 时间:0
  • 页码:10-13
  • 分类:TP311.13[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]东北大学信息科学与工程学院,沈阳110819
  • 相关基金:国家自然科学基金(编号:60973018,60973020); 教育部博士点基金(编号:20110042110028); 中央高校基本科研业务费专项基金(编号:N110804002,N100704001)资助
  • 相关项目:面向相似性数据的自适应世系管理关键技术研究
中文摘要:

数据起源主要描述数据的来源及随时间演化的过程。最小化查询数据表的标识属性传播是一个亟待解决的问题。通过构建等值传播链表EPL描述查询中的等值连接及其传递性,并基于EPL给出朴素标识属性传播方法实现高效溯源信息传播。然而标识属性通过等值连接可以识别非标识属性数值,简单地传播数据表的标识属性数值导致起源数据冗余传播。为避免溯源信息冗余,提出完全标识属性传播格及其剪枝策略,给出基于格剪枝的最优标识属性传播方法,实现溯源信息的最小代价传播。基于TPC-H Benchmark和人造数据集IAP-DB的实验结果验证了提出的基于标识属性传播的溯源方法可以高效实现数据起源信息传播。

英文摘要:

Data provenance describes the origin and the history of derived data.How to minimize identifier propagation in relational databases is a challenge problem.An equal value propagation list(EPL) is built to describe propagations based on equal values.Nave identifier propagation method is proposed based on EPL to efficiently propagate data provenance.However,simply propagating a relation's identifying attributes may result in redundantly propagating provenances because that identifier can identify non-identifiers through equal join operations.In order to avoid such redundancy,a complete identifier propagation lattice and corresponding pruning strategies is proposed.A lattice-pruning optimal identifier propagation method is proposed,which can efficiently propagate data provenance in relational databases with the minimized cost.Experimental results on TPC-H Benchmark and synthetic data IAP-DB show that our provenance tracing method based on propagating identifiers can efficiently propagate data provenance in relational database.

同期刊论文项目
期刊论文 17 会议论文 10 专利 1
同项目期刊论文
期刊信息
  • 《计算机与数字工程》
  • 主管单位:中国船舶重工集团公司
  • 主办单位:中船重工集团公司七院第七0九研究所
  • 主编:王小非
  • 地址:武昌74223信箱
  • 邮编:430074
  • 邮箱:jssg@chinajournal.net.cn
  • 电话:027-87534308 87534205
  • 国际标准刊号:ISSN:1672-9722
  • 国内统一刊号:ISSN:42-1372/TP
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:13630