东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

用于改善web搜索的结构化数据抽取技术

ISSN号：1003-7985
期刊名称：《东南大学学报：英文版》
时间：0
分类：TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
作者机构：[1]东北大学信息科学与工程学院,沈阳110004
相关基金：Program for New Century Excellent Talents in University（No. NCET-06-0290）, the National Natural Science Foundation of China （No. 60503036）, the Fok Ying Tong Education Foundation Award（ No. 104027）.

作者：郭茜[1], 杨晓春[1], 于戈[1], 李广翱[1]

关键词： WEB, 语义, 属性关系, 结构化数据, 查询扩展, web, semantic, attributes relationship, structure data, query expansion

中文摘要：

为了提高web文本搜索质量,提出了基于语义结构化数据的查询扩展方法.通过分析属性的语义特征（文档频率特征和辨识能力特征）将属性分为概念属性、背景属性和无用属性3类,并且提出了衡量属性语义相关度的标准.设计了trie-bitmap和pair pointer table数据结构来实现发掘属性语义特征和检测属性语义相关度的有效算法.通过使用合适的属性和它们的语义关系,可以为查询关键字生成扩展词并将它们嵌入到具有插值参数的向量空间模型中.实验使用IMDB电影数据库和真实文本数据集来比较所提方法和原始向量空间模型的性能.实验结果证明所提出的查询扩展方法可以有效地提高文本搜索性能,同时属性语义特征和属性语义相关度都具有良好的分类能力.

英文摘要：

In order to improve the quality of web search,a new query expansion method by choosing meaningful structure data from a domain database is proposed.It categories attributes into three different classes,named as concept attribute,context attribute and meaningless attribute,according to their semantic features which are document frequency features and distinguishing capability features.It also defines the semantic relevance between two attributes when they have correlations in the database.Then it proposes trie-bitmap structure and pair pointer tables to implement efficient algorithms for discovering attribute semantic feature and detecting their semantic relevances.By using semantic attributes and their semantic relevances,expansion words can be generated and embedded into a vector space model with interpolation parameters.The experiments use an IMDB movie database and real texts collections to evaluate the proposed method by comparing its performance with a classical vector space model.The results show that the proposed method can improve text search efficiently and also improve both semantic features and semantic relevances with good separation capabilities.

同期刊论文项目

以数据为中心的无线传感器网络查询处理与查询优化技术研究

期刊论文 55 会议论文 20 获奖 4 著作 1

同项目期刊论文

数据流挖掘研究及其进展

面向无线传感器网络的流数据压缩技术

一种数据流上基于截止期的多查询过载预测模型

A Filter-based Uniform Algorithm for Optimizing Top-k Query in Distributed Networks

基于混合语言模型的文档相似性计算模型

无线传感器网络中网关处的数据获取与处理

WSN 中带有分布式入侵检测的分簇路由协议

Choosing Meaningful Structure Data for Improving Web Search

无线传感器网络能量有效的实时查询处理方法

An Algorithm for Optimizing Multidimensional K-NN Queries in Wireless Sensor Networks

支持截止期敏感应用的数据流任务调度方法

数据流处理中确定性QoS的保证方法

数据发布中面向多敏感属性的隐私保护方法

支持多约束的K-匿名化方法

关系数据库中支持语义的Top-K关键字搜索（英文）

一种基于过滤器的无线传感器网络复杂查询优化算法

一种数据流上截止期敏感的滑动窗口处理策略

支持无线传感器网络的实时查询技术研究

无线传感器聚簇网络中基于多属性的时空关联异常节点检测技术

传感器聚簇网络中一种面向感知数据的变长窗口动态调整技术

移动传感器网络中基于区域理想覆盖的传感器重定位技术

无线传感器网络中一种基于历史数据分组的感知查询技术

无线传感器网络中一种基于权重模型的高效事件检测技术

MIS：无线传感器网络中一种基于多级映射索引的存储方法

数据发布中维护敏感数据高可用性的隐私保护方法

一种基于过滤器的无线传感器网络近似K-NN查询优化算法

数据流上基于扩展窗口模型的连接维护算法

一种无线传感器网络中基于时空关联模型的高效实时事件检测技术

无线传感器网络中基于模式序列分类的分布式数据流过滤方法

动态的分布式查询下的top-k查询计算

一种数据流上统计性查询QoS的保证方法

Adaptive Correlation Analysis in Stream Time Series with Sliding Windows

一种无线传感器网络中基于缓冲区管理的查询处理方法

Efficient Secure Data Publishing Algorithms for Supporting Information Sharing

Answering Form-Based Web Queries using the Data-Mining Approach

Adaptive Maintenance for Classified Sliding Window Joins over Data Streams

Design and Implementation of File Access and Control System Based on Dynamic Web

Continually Answering Constraint k-NN Queries in Unstructured P2P Systems

基于历史数据的轮廓聚合查询

无线传感器网络中一种基于窗口的近似连续查询的处理技术

分布式专家系统中时序控制的研究与设计

数据流中一种快速启发式频繁模式挖掘方法

基于最长顺序频繁词组的Web文献检索结构

动态的分布式环境下Top-k查询计算

面向无线传感器网络多连接的数据卸载策略

结构化网络中聚合Top-K查询优化技术

一种基于过滤器的无线传感器网络近似kNN查询优化算法

无线传感器网络中基于确定度的安全路由协议的研究

一种无线传感器网络中的多维K-NN查询优化算法

无线传感器网络中基于模式序列分类的分布式数据流过滤技术

关系数据库中支持语义的Top-K关键字搜索

期刊信息

《东南大学学报：英文版》

主管单位:教育部
主办单位:东南大学
主编：毛善锋
地址：南京市四牌楼2号
邮编：210096
邮箱：xuebao@seu.edu.cn
电话：025-83794323 83794343传

国际标准刊号：ISSN：1003-7985
国内统一刊号：ISSN：32-1325/N
邮发代号:

获奖情况:
2010年和2012年荣获第三届和第四届中国高校优秀科...

国内外数据库收录:
美国化学文摘（网络版）,美国数学评论（网络版）,德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库

被引量:493