东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

用Capture-Recapture方法估计Web数据库大小

ISSN号：1001-3695
期刊名称：《计算机应用研究》
时间：0
分类：TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
作者机构：[1]苏州大学智能信息处理研究所,江苏苏州215006
相关基金：国家自然科学基金资助项目（60673092）;2005年度国家教育部科研重点项目（205059）;2006年江苏省“六大人才高峰”项目（06-E-037）;2006年度江苏省软件和集成电路业专项经费资助项目（[2006]221-41）

作者：苗忠义[1], 胡鹏昱[1], 崔志明[1]

关键词：大小估计, 深网, 网络数据库, size estimation, Deep Web, Web database

中文摘要：

为了估计网络数据库的大小，提出了基于Capture—Recapture过滤二字亲密、二字排斥的方法。通过在接口文本框提交属性高频字，利用返回的结果集，在两两之间作交集，根据交集中的两字分布分析采样的独立性，过滤掉其中不独立的情况，再利用Capture—Recapture方法估计网络数据库的大小。在模拟和真实的环境下进行了实验．该方法偏差度和波动度均较小。

英文摘要：

In order to estimate the size of Web database, this paper proposed the Capture-Recapture based estimation methods that filtered out two words intimate and rejection cases. Submitting attributed high-frequency words in the text box of query interface, using the returned result, in the intersection of two results analyzing the independence of two sampling, filtering the dependent couples, and then using Capture-Recapture method estimated the size of Web database. In the simulated and real environment for the experiment, the bias and the volatility of the method are smaller.

同期刊论文项目

面向Deep Web的不完备知识处理的逻辑模型研究

期刊论文 46 会议论文 9 专利 3

同项目期刊论文

A heuristic contour prolog list method used in logical reinforcement learning

Data fusion algorithm based on Bayes sequential estimation for wireless sensor network

Identifying query interfaces of deep web entries automatically

An Efficient Strategy for Enhancing Robustness and Immunization in Wireless Sensor Networks.

Learning to rank deep web

An investigation on local area control of compromised nodes spreading in wireless sensor networks

Tableau model of the incomplete knowledge repairing based on web database

Logical reinforcement learning method based on heuristic contour list

一种逻辑强化学习的tableau推理方法

关系强化学习方法的初步研究

遗传反馈的多特征图像检索

A Logical Model Oriented to the Incomplete Knowledge Processing of Deep Web

Automated reasoning expanded method based on set signs

Automatic hierarchical cluster of structured Deep Web by query probing

AVS video coding based on global motion compensation

结构化信息的去重方法

基于属性高频字的深网数据库重叠率估计

一种新的基于区域增长的ROI分割算法

基于视差梯度约束的匹配点提纯算法

低复杂度空域错误隐藏算法

扩展的Deep Web质量估计模型研究

一种基于脑血管图像特征的快速边界跟踪算法

结合视频分割的形状编码算法

结合逻辑和决策论方法的Agent模型研究

一种基于启发式轮廓表的逻辑强化学习方法

面向agent的统一知识表示与推理逻辑框架

一种Deep Web聚焦爬虫爬行策略

结合Gaussian分布和LK光流法的视频对象分割算法

基于蚁群算法的神经网络规则抽取

复杂Web页的Wrapper自动化生成技术研究

基于领域样本查询的Deep Web数据库分类

一种Deep Web数据源质量评估模型

一种基于内容的快速视频运动对象分割算法

基于语义的Deep Web数据源自动发现技术

一种基于水平集的运动视频对象分割算法

数据挖掘中聚类算法的新发展

一种基于集合符号的自动推理扩展方法

一种多分类器Deep Web数据源的自动分类与判别方法

一阶逻辑公式自动推演前的预处理

基于Bayes序贯估计的无线传感器网络数据融合算法

传感器网络病毒感染传播局域控制研究

期刊信息

《计算机应用研究》
北大核心期刊（2011版）

主管单位:四川省科学技术厅
主办单位:四川省计算机研究院
主编：刘营
地址：成都市成科西路3号
邮编：610041
邮箱：arocmag@163.com
电话：028-85210177 85249567

国际标准刊号：ISSN：1001-3695
国内统一刊号：ISSN：51-1196/TP
邮发代号:62-68

获奖情况:
第二届国家期刊奖百种重点科技期刊,国内计算技术类重点核心期刊,国内外著名数据库收录期刊

国内外数据库收录:
俄罗斯文摘杂志,波兰哥白尼索引,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:60049