东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

基于特征相关学习的网页信息提取方法

ISSN号：1671-4512
期刊名称：《华中科技大学学报：自然科学版》
时间：0
分类：TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
作者机构：[1]华中科技大学计算机科学与技术学院,湖北武汉430074, [2]华中科技大学管理学院,湖北武汉430074；, [3]华中师范大学外国语学院,湖北武汉430079
相关基金：国家自然科学基金资助项目（60403027）;中国博士后科学基金资助项目（20060400846）.

关键词：信息提取, 特征学习, 过滤, 网页信息, information extraction, feature learning, filtration, Web page information

中文摘要：

为了给出网页信息提取方法的数学形式化的理论分析,首先用一维空间域的信息函数来表示网页信息,并通过分析网页过滤过程,推导出网页信息过滤定理.然后通过分析网页的相似性,推导并提出一种基于相关过滤的网页特征信息的提取理论.在这个理论基础上,融合基于标识规则和基于内容规则的两种方法,提出一种基于特征相关学习的网页信息提取方法.导出的特征提取理论和实验结果表明这种方法具有较好的准确率.

英文摘要：

Web page information was denoted by one-dlmension space information function to present the theoretical analysis of information extraction of Web pages in mathematical form. The theorem of Web page information filtration was deducted after analyzing the process of Web information filtration. And then a novel feature extraction theory of Web pages based on correlative filtration was deducted after analyzing similar features of Web pages. Thus based on the feature extraction theory, a novel adaptive information extraction method with feature learning for Web pages is proposed, through combining the label-based extraction method and the context-based extraction method. Both the deducted feature extraction theory and the experiment results show the adaptive information extraction method for Web pages has good accuracy.

同期刊论文项目

基于多自治域的信息交换风险评估模型研究

期刊论文 174 会议论文 22 获奖 6 著作 1

同项目期刊论文

一种Peer-to-Peer环境下的分布式

Resolution for Conflicts of In

基于Watson视觉感知模型的能量调制水印算法

基于Watson视觉模型的自适应视频水印

一类不可表示的多部秘密共享拟阵

一种支持多维资源描述的高效P2P路由算法

基于描述逻辑的推理系统设计与实现

基于模糊理论的P2P网络主观信任模型-FSTM

一种基于主题相关度的网页排序算法

树形层次化组织机构中的分级访问控制模型(英文)

Web服务组合规范WS-CDL的类型化形式化模型

关于不可表示的多部秘密共享拟阵

基于移动代理的P2P网络安全风险

Centralized Role-Based Access

dRBAC模型的安全分析

基于信任保留的移动Ad Hoc网络安

一种支持多维资源描述的高效P2P

Least Privileges and Role’s I

分布式异常检测中隐私保持问题研

基于信任度的授权委托模型

基于角色访问控制管理模型的安全

一种Ad Hoc 网络中安全的网格路

签密的仲裁安全与仲裁安全的签密

一个群签名方案的密码学分析与改

基于本体的多域访问控制策略集成

OntoRBAC：基于本体的RBAC策略描

辫子群上的公钥加密算法

基于Watson视觉感知模型的能量调

多域间动态角色转换的职责分离

Time-Based Dynamic Trust Model

Self-Orangized Public-Key Mana

一种基于访问历史的BLP模型

一种Peer_to_Peer环境下的综合信

多数据库系统中的全局查询转换方

A Relation-Based Search Engine

Novel Scheme to Specify and In

Agent Based Automated Trust Ne

针对负载均衡的P2P动态副本策略

P2P 环境下局部可信度的神经网络

一种基于主观逻辑理论的P2P网络

辫子群上新的难解问题及其密码学

一种基于变调整学习规则的模糊网

Trust Authentication Protocol

多自治域系统中安全互操作风险的

Construction and Resource Loca

基于专家综合评定法的多自治域安

基于2型模糊描述逻辑的知识描述

多域安全互操作的可管理使用控制

Trust Degree of Web Services a

A Routing Algorithm for Risk-s

A Reputation-Based Trust Manag

Authorization Management Frame

开放系统中基于历史角色的快速协商模型

一种基于任务和角色的计算网格访问控制模型

一种自适应的多域安全互操作模型

Caching Scheme Based on Power-Law Characteristic in Unstructured P2P Networks

树形层次化组织机构中的分级访问控制模型

基于链接重要性的动态链接预测方法研究

基于任务的计算网格访问控制模型研究

基于移动代理的网络安全审计策略

一种基于任务的计算网格访问控制模型

组合公钥密码的网格身份认证机制

邮件病毒传播的迭代模型

分布式环境下保持隐私的关联规则挖掘算法

一种可信多重密钥共享认证方案

一种多策略的门限群签名方案

基于绝对信任模型的Ad Hoc网络自组织公钥管理机制

前向安全的有代理的多重数字签名方案

基于专家综合评定法的多自治域安全互操作的风险评估方法

P2P环境下局部可信度的神经网络识别方法

一种Peer—to—Peer环境下的综合信任模型

Ad hoc网络中一种安全的Fisheye路由协议

基于签密的分布式安全门限阈下信道方案

标准模型中可证安全的基于ID的身份认证方案

开放系统中信任的自动建立

面向移动设备的WEB页面分块算法

基于本体的多域访问控制策略集成研究

基于信任保留的移动Ad Hoc网络安全路由协议TPSRP

一种基于小波变换的图像自适应盲水印算法

WebPeer：一个基于P2P的Web服务平台

入侵检测系统的多层次模糊综合评价研究

基于扩展攻击树的信息系统安全风险评估

基于时态逻辑的自动信任协商模型

Ad hoc网络中的一种自组织网络层安全方案

一种基于RSA安全可行的（t，n）门限签名方案

移动自组网络分布式组密钥管理方案

基于JXTA架构的对等网络关键技术研究

无线传感网络中一种安全的LEACH协议

大规模Ad hoc网络中一种高效的组密钥协商协议

一种传感器网络应用的面向服务体系结构

基于Petri网的混合安全策略建模与验证

P2P网中基于文件分片的副本建立策略

一个改进的前向安全的多重签名方案

两个前向安全的代理签名方案的安全性分析

一种Ad Hoc网络中安全的网格路由协议

可信移动计算与数字版权管理综合方案

辫子群上新的难解问题及其密码学应用研究

不确定外部竞争和选择下的动态双边协商决策模型

一种基于变调整学习规则的模糊网页分类方法研究

基于角色访问控制管理模型的安全性分析

一个无证书的环签名方案

一个前向安全的代理签名方案的分析与改进

一种改进的非结构化P2P网络搜索方法

基于粗糙集理论的电网安全性分析

基于PKI与PMI的办公自动化系统访问控制

一种公钥自认证的(t,n)门限签名方案

基于隐私保护的语义数据集成

网络病毒传播模型中的两个问题

基于本体的通用知识网格架构研究

资源限制信任协商

分布式异常检测中隐私保持问题研究

一种基于主观逻辑理论的P2P网络信任模型

基于移动代理的P2P网络安全风险评估

信任协商的职责行为和约束

Web服务相容性的形式化描述与分析

SPKI/SDSI证书在信息化指挥系统中的应用

Web语义的分类和缓存(英文)

一种对IP拥塞控制算法的改进方法

Dynamically Authorized Role-Based Access Control for Grid Applications

信息系统中正区域性质的研究与应用

基于RSA体制的数字移动通信系统用户认证方案

Anomaly Detection Based on Data-Mining for Routing Attacks in Wireless Sensor Networks

IJncertainty Modeling Based on Bayesian Metwork in Ontology Mapping

一个完全分布式的可追踪门限-多重签名方案

多域环境下的分布式RBAC模型

Efficient Dynamic Threshold Group Signature Scheme Based on Elliptic Curve Cryptosystem

Least Privileges and Role＇s Inheritance of RBAC

Self-Organized Public-Key Management for Mobile Ad Hoc Networks Based on a Bidirectional Trust Model

A Routing Algorithm for Risk.Scanning Agents Using Ant Colony Algorithm in P2P Network

Novel Web Query Automatic Expansion Based on Rough Set

New Public Key Cryptosystems from Combinatorial Group Theory

Data Mining Ontology Development for High User Usability

Secure Order-Specified Multisignature Scheme Based on DSA

A TTP-Independent Watermarking Protocol Based on Commutative Cryptosystem for Copyright Protection in E-Commerce

Centralized Role-Based Access Control for Federated Multi-Domain Environments

Trust Calculation and Delivery Control in Trust-Based Access Control

A Practical Approach to Attaining Chosen Ciphertext Security

Construction and Resource Locating of Semantic P2P Grid Based on Description Logics

A Cooperative Schema between Web Sever and Search Engine for Improving Freshness of Web Repository

Threshold Subliminal Channel Based on Designated Verifier Signature

Dynamically Computing Approximate Frequency Counts in Sliding Window over Data Stream

Resolution for Conflicts of Inter-Operation in Multi-Domain Environment

Efficient and Robust Two-Party RSA Key Generation

Context-Aware Usage-Based Grid Authorization Framework

Trust Degree of Web Services and Its Evaluation with Neural Network

History-based trust negotiation model

A Formal Model for BPEL4WS Description of Web Service Composition

The Research of an Incremental Conceptive Clustering Algorithm and Its Application in Detecting Money Laundering

Trust Authentication Protocol on the Web

Authorization Management Framework Based on Joint Trust-Risk Evaluation

Merkle Tree Digital Signature and Trusted Computing Platform

Time-Based Dynamic Trust Model Using Ant Colony Algorithm

A Partially Non-Cryptographic Security Routing Protocol in Mobile Ad Hoc Networks

Cryptanalysis and Improvement of Digital Multisignature Scheme Based on RSA

一种新型的环签名方案

适合大群组的高效群签名方案改进

A colored Petri net-based model for web service composition

A Secure and Pragmatic Routing Protocol for Mobile Ad hoc Networks

A Layer-Cluster Key Agreement Protocol for Ad Hoc Networks

改进的基于中国剩余定理群签名方案

基于角色的访问控制中的安全三原则

一种Peer-to-Peer环境下的分布式访问控制模型

一个群签名方案的密码学分析与改进

一种基于RSA的混合签密方案

语义搜索引擎Smartch的设计与实现

一种基于本体的RBAC策略与集成方法

一种基于代理的自动信任协商模型

基于Petri网的保密性策略建模与验证

基于信任的普适计算的动态授权模型

Task-and-role-based access-control model for computational grid

一种基于签密的移动自组网络身份认证方案

移动自组网环境下基于推荐的信任模型

期刊信息

《华中科技大学学报：自然科学版》
中国科技核心期刊

主管单位:中华人民共和国教育部
主办单位:华中科技大学
主编：丁烈云
地址：武汉珞喻路1037号
邮编：430074
邮箱：hgxbs@mail.hust.edu.cn
电话：027-87543916 87544294

国际标准刊号：ISSN：1671-4512
国内统一刊号：ISSN：42-1658/N
邮发代号:38-9

获奖情况:
全国优秀科技期刊,首届国家期刊奖,第二届全国优秀科技期刊评比一等奖,中国期刊方阵“双效”期刊

国内外数据库收录:
俄罗斯文摘杂志,美国化学文摘（网络版）,美国数学评论（网络版）,德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）

被引量:21013