位置:成果数据库 > 期刊 > 期刊详情页
一种基于范围型属性的Deep Web数据提取方法
  • ISSN号:1000-386X
  • 期刊名称:计算机应用与软件
  • 时间:2013.2.2
  • 页码:54-57
  • 分类:TP3[自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]苏州普达新信息技术有限公司,江苏苏州215021, [2]苏州大学智能信息处理及应用研究所,江苏苏州215006
  • 相关基金:国家自然科学基金项目(60970015,61003054); 江苏省高校自然科学研究项目(10KJB520018); 苏州市科技型企业技术创新资金专项(SG201043)
  • 相关项目:Deep Web敏感聚合信息保护方法研究
中文摘要:

针对在Deep Web数据库查询结果存在上限k的情况下,对于如何提取数据记录的问题,提出一种基于范围型属性的数据提取方法。利用范围型属性的值域特征,将其值域按照目标数据库的分布样本划分为多个子区间。实验结果表明,按照该方法划分的子区间,使得查询收益,查询饱和度和已提取数据的覆盖程度等指标均达到98.50%以上。

英文摘要:

This paper presents a range property-based data extraction method aiming at the problem of how to extract data records in condition that the query result of Deep Web database has upper limit k.Making use of numerical field feature of the range property,we divide its numerical field into several subintervals according to the distribution sample of object database.The results of experiments show that the subinterval partitioned in this method enables the indexes including query gains,query saturation and the coverage degree of extracted data,etc.,all reach 98.5% and higher.

同期刊论文项目
期刊论文 49 会议论文 8 专利 6
期刊论文 37 会议论文 4 获奖 3 专利 3
同项目期刊论文
期刊信息
  • 《计算机应用与软件》
  • 北大核心期刊(2011版)
  • 主管单位:上海科学院
  • 主办单位:上海市计算技术研究所 上海计算机软件技术开发中心
  • 主编:朱三元
  • 地址:上海市愚园路546号
  • 邮编:200040
  • 邮箱:cas@sict.stc.sh.cn
  • 电话:021-62254715 62520070-505
  • 国际标准刊号:ISSN:1000-386X
  • 国内统一刊号:ISSN:31-1260/TP
  • 邮发代号:4-379
  • 获奖情况:
  • 全国计算机类中文核心期刊
  • 国内外数据库收录:
  • 波兰哥白尼索引,美国剑桥科学文摘,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2011版),中国北大核心期刊(2000版)
  • 被引量:27463