位置:成果数据库 > 期刊 > 期刊详情页
大数据质量管理:问题与研究进展
  • ISSN号:1000-7857
  • 期刊名称:《科技导报》
  • 时间:0
  • 分类:TP311.13[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]哈尔滨工业大学计算机科学与技术学院,哈尔滨150001
  • 相关基金:基金项目:国家重点基础研究发展计划(973计划)项目(2012CB316200);国家自然科学基金项目(61472099)
作者: 王宏志[1]
中文摘要:

当前大数据在多个领域广泛存在,大数据的质量对其有效应用起着至关重要的作用,因而需要对大数据进行质量管理。尽管数据质量管理方面已经有一些研究成果,但由于大数据具有规模大、速度快和多样性高的特点,现有的方法难以适用于大数据质量管理。本文针对错误发现、错误修复和劣质数据查询处理,综述了大数据质量管理的问题与挑战,认为大数据质量管理的挑战主要有计算困难、错误混杂和缺少知识3个方面。本文依据这3个方面的解决方法,对大数据质量管理目前的研究进展进行了综述,并展望了大数据质量管理未来的研究方向。

英文摘要:

Big data have wide applications. Since the quality of big data plays a crucial role in these data-centric applications, data quality management techniques for big data are in demand. Although some theories and techniques for data quality management have been proposed, due to the volume, variety and velocity of big data, current methods could hardly be applied to data management for big data. This paper discusses the problems and challenges for error detection, error repair and query processing of dirty data in big data management, and identifies intractability, mixed errors and the lack of knowledge as three new challenges to data quality management. The progress of big data quality management in these three aspects is reviewed and open problems for future research are proposed.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《科技导报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国科学技术协会
  • 主编:项昌乐
  • 地址:北京市海淀区学院南路86号科技导报社
  • 邮编:100081
  • 邮箱:kjdbbjb@cast.org.cn
  • 电话:010-62138113
  • 国际标准刊号:ISSN:1000-7857
  • 国内统一刊号:ISSN:11-1421/N
  • 邮发代号:2-872
  • 获奖情况:
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),英国农业与生物科学研究中心文摘,波兰哥白尼索引,美国乌利希期刊指南,美国剑桥科学文摘,英国科学文摘数据库,中国中国科技核心期刊,中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:24858