位置:成果数据库 > 期刊 > 期刊详情页
基于用户反馈的深网数据源选择
  • 期刊名称:小型微型计算机系统
  • 时间:0
  • 页码:-
  • 分类:TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]江西财经大学信息管理学院,南昌330013, [2]江西财经大学数据与知识工程江西省高校重点实验室,南昌330013
  • 相关基金:国家自然科学基金项目(61173146,60803105,60863016)资助
  • 相关项目:基于用户反馈的Web数据集成中的数据质量管理
中文摘要:

在因特网上,每个主题往往拥有成百上千个相关的深网数据源,从众多的数据源中找到合适的源进行数据集成变得越来越重要.传统的考虑源质量的选择方法是不考虑源主题特性的,而是根据经验选取统一的质量维度,因而在不同主题下选择准确性有较大的差异.基于此,提出基于用户反馈的深网源选择方法,依据用户反馈获取特定主题源的核心质量维度从而建立质量评价模型.选取了三个不同主题下的数据源进行了相关的验证,实验结果表明,针对不同主题下的数据源选取,该方法均具有较高的准确性且计算量较少.

英文摘要:

There are hundreds or thousands of Web data sources providing data of relevance to a particular domain on the Web,so how to find a suitable result quickly to integrate from a number of sources is becoming more and more important.Traditional data sources selection methods based on source quality do not take quality characteristics of different data sources under the specific domain into account,but selecting the same quality dimensions for quality evaluation models.Therefore,accuracy of traditional methods under different domains are quite different.In light of this,we propose a Deep Web source selection method based on user feedback,we gain accurate core quality dimensions of a particular domain base on user feedback,then achieve a quality estimation model for the data sources.In experiment,we choose many data sources in three domains to carry test.The experiment result shows that it is of good accuracy and computational efficiency to choose data sources for different domains.

同期刊论文项目
期刊论文 21 会议论文 15
期刊论文 44 会议论文 8 获奖 1
同项目期刊论文