位置:成果数据库 > 期刊 > 期刊详情页
数据质量维度量化方法
  • ISSN号:1002-8331
  • 期刊名称:《计算机工程与应用》
  • 时间:0
  • 分类:TP311.13[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]南京邮电大学计算机技术研究所,南京210003, [2]东南大学计算机科学与工程学院,南京210096
  • 相关基金:国家自然科学基金(the National Natural Science Foundation of China under Grant No.60573164 );江苏省“十五”高科技项目(N02G2001013);南京邮电大学科研基金(No.NY207136).
中文摘要:

为了实现自动化的数据质量评估,提出了一种在背景范围内的数据质量量化方法QDC(Quantify Dimensionswithin Context)。数据质量可以用数据和其对应实体的“完美表达”间的差距来衡量。由于“完美表达”很难获得或代价很高,因此提出在多数据源条件下,数据的“完美表达”可以在其背景范围内用投票获得的“最近似”来替代,从而确定了数据质量评估参照的标准。同时提出利用信息论中信息熵指标,将不同类型数据的质量维度统一为通用的度量。作为一种自动化的数据质量评估方法,QDC方法不仅能够对数据的准确性和完整性维度给出准确的评估值,并且具有很高的计算效率。

英文摘要:

To automatically quantify data quality dimensions in multiple-source environment,it proposes a novel approach to auto- matically Quantify Dimensions within Context (QDC).Data quality can be gauged by discrepancy between data view and its entity's perfect representation.Since it is difficult to obtain the perfect representation of entity,it proposes to approximate the perfect representation within its available context and quality dimensions can be quantified in this context scope.By naturally borrowing entropy concepts from information theory,the measurement is easily given for different types of data.In this way,the two most important quality dimensions,that are accuracy and completeness,are properly quantified.This QDC approach can not only give an objective score and ranking in a cooperative multi-source environment but also avoid human's laborious interaction.As an automatic quality rating solution this approach is distinguished,especially for large scale datasets.Theory and experiment shows the approach performs well for quality rating.

同期刊论文项目
期刊论文 16 会议论文 7 著作 1
同项目期刊论文
期刊信息
  • 《计算机工程与应用》
  • 北大核心期刊(2014版)
  • 主管单位:中国电子科技集团公司
  • 主办单位:华北计算技术研究所
  • 主编:怀进鹏
  • 地址:北京市海淀区北四环中路211号北京619信箱26分箱
  • 邮编:100083
  • 邮箱:ceaj@vip.163.com
  • 电话:
  • 国际标准刊号:ISSN:1002-8331
  • 国内统一刊号:ISSN:11-2127/TP
  • 邮发代号:82-605
  • 获奖情况:
  • 1. 2012年首批获得中国学术文献评价中心发布的 “...,2. 2001年获得新闻出版署“中国期刊方阵双效期刊”,3. 2008年首批入选国家科技部“中国精品科技期刊...,4.2003年-2011年连续获得工业和信息化部期刊最高...
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:97887