位置:成果数据库 > 期刊 > 期刊详情页
基于数据源依赖关系的信息评价方法研究
  • ISSN号:0254-4164
  • 期刊名称:《计算机学报》
  • 时间:0
  • 分类:TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]哈尔滨工程大学计算机科学与技术学院,哈尔滨150001, [2]闽南理工学院信息管理系,福建石狮362700
  • 相关基金:本课题得到国家自然科学基金(60803037,61202090,61272184)、教育部新世纪人才支持计划(NCET-11-0829)、黑龙江省自然科学基金(F201130,F201016)、哈尔滨市科技创新人才研究专项基金(RC2010Q010024)和中央高校基本科研业务费专项资金(HEUCFZ1010,HEUCFT1202)资助.致谢本实验所用的数据集由DongXinLuna和YinXiaoxin两位博士提供,在此感谢她们的指导和答疑解惑!
中文摘要:

当前很多的数据管理应用都需要从多个数据源集成数据,每个数据源都会提供一组值,并且不同的数据源常常提供相互冲突的数据值.为了提供给用户高质量的数据值,关键是数据集成系统能够解决数据冲突问题,提取出正确的数据值.文中对已有的真值发现算法进行了分析与总结,通过考虑处理同一个值的不同表现形式和改进的选票算法,作者对现有方法给出了改进,改进后的方法可以更有效地在众多冲突数据中找出正确的数据值.

英文摘要:

Many data management applications require integrating data from multiple sources. Each of these sources provides a set of values and different sources can often provide conflicting values. To present quality data to users, it is critical that data integration systems can resolve conflicts and discover true values. In this paper, we improve the existing algorithm with using a new voting algorithm and considering the diverse expressions of the same value, e.g. person's name. The experiment results shown it is very effective for discovering true values among conflicting values.

同期刊论文项目
期刊论文 13 会议论文 4 获奖 4
同项目期刊论文
期刊信息
  • 《计算机学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国计算机学会 中国科学院计算技术研究所
  • 主编:孙凝晖
  • 地址:北京中关村科学院南路6号
  • 邮编:100190
  • 邮箱:cjc@ict.ac.cn
  • 电话:010-62620695
  • 国际标准刊号:ISSN:0254-4164
  • 国内统一刊号:ISSN:11-1826/TP
  • 邮发代号:2-833
  • 获奖情况:
  • 中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 美国数学评论(网络版),荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:48433