东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

ERE:基于半结构化Web页面的实体关系抽取系统

ISSN号：1672-9722
期刊名称：计算机与数字工程
时间：2014.9.20
页码：1581-1586+1662
分类：TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]东北大学信息科学与工程学院,沈阳110819
相关基金：国家自然科学基金（编号：61033007）;教育部博士点基金（编号：20120042110028）;教育部-英特尔信息技术专项科研基金（编号：MOE-INTEL-2012-06）资助.
相关项目：数据密集型计算环境下的数据管理方法与技术

作者：余东|李诺|申德荣|汤楠|徐宏斌|寇月|于戈|

关键词：实体关系, 实体关系抽取, 数据抽取, 实体匹配, entity relationship, entity relationship extraction, data extraction, entity matching

中文摘要：

传统的实体关系抽取方法主要针对语义信息较为完整的文本,基于抽取模式抽取文本中的实体关系,并采用启发式算法或者概率模型来选择抽取出的候选关系.而对于半结构化的页面,由于没有成句的实体信息展示,导致这些方法不能很好适用.论文提出的实体关系抽取系统能较好地处理半结构化的页面.该系统主要包括数据抽取规则学习、数据抽取、实体间关系计算等核心功能模块,并为用户提供了关系库查询接口.用户输入关键词和选定匹配类型,系统将根据关键词及匹配类型查询实体信息库,然后用满足条件的实体再去查询实体关系库,将包含这些实体的关系返回给用户.

英文摘要：

In traditional methods, researchers use extraction pattern to extract entity relationships in text fragments that have complete semantic information. And they use heuristic algorithms or probabilistic models to choose the extracted candidate relationships. As for the semi-structured web pages, these methods become less applicable because the information of the entities is shown in some html modules where the semantic information is not complete. In this paper, an entity relationship extraction system that can solve the problem perfectly is propsoed. The system is composed of four functional modules： data extraction rule learning module, data extraction module, entity relationship compute module and entity relationship base query module. Firstly, users give a key word and choose a matching type. And the system will query the entity information base and find some entities that meet the conditions. Then the system will query the entity relationship base with the entities founded previously. Finally, the relationships that contain the entities will be returned to users.

同期刊论文项目

数据密集型计算环境下的数据管理方法与技术

期刊论文 125 会议论文 77

同项目期刊论文

面向路网的不确定移动范围查询技术

A framework for supporting tree-like indexes on the Chord overlay

异构存储系统性能监测技术研究

多层次RFID数据流上复杂事件检测

大规模图挖掘算法并行化研究

基于ETW的Windows系统性能监测技术

基于MapReduce的封闭数据立方

一种基于局部冲突分配的DST组合规则

Asyn-SimRank:一种可异步执行的大规模SimRank算法

大图数据上顶点驱动的并行最小生成树算法

Efficient mining differential co-expression biclusters in microarray datasets

一种云环境下基于分级管理的自律计算模型

MapReduce集群中最大收益问题的研究

在线视频点播系统节能方法与策略研究

TBPRS:基于信任关系的社交用户推荐系统

Lightweight Locking for Main Memory Database Systems

面向路网空间的不确定性移动范围查询技术的研究

基于消息传递机制的MapReduce图算法研究

RM-LCDF:一种块级连续数据保护高效数据恢复方法

用户评论的质量检测与控制研究综述

面向路网的不确定移动范围查询

针对不确定射频识别数据流的改进概率推导方法

基于共享的MapReduce多查询优化技术

基于私有云的虚拟实验平台的设计与实现

基于蛋白质网络的模块动态特性挖掘研究

Semantic relevance ranking for XML keyword search

云计算环境下的大规模图数据处理技术

针对不确定RFID数据流上的改进概率推导方法

<h3 style="color:#222222;text-indent:0px;background-color:#FFFFFF;" class="gs_rt&q

Scalable SPARQL querying of large RDF graphs

FDSS:基于HDFS的海量音乐特征数据存储系统

SERA:股票历史交易重现和分析的原型系统

一种基于LBS的移动个性化推荐系统

基于MapReduce的数据聚集运算算法

云存储性能评测技术与方法研究

A high-level energy consumption model for heterogeneous data centers

云存储性能评测技术研究

海量存储系统能耗评测模型的研究

面向BSP 模型的负载均衡Hash 图数据划分

应用信息论的数据导向模式匹配方法

不确定RFID数据流上基于熵的数据推导方法

S-TRAP: Optimization and Evaluation of Timely Recovery to Any Point-in-time (TRAP)

RFID交叉读仲裁方法研究

RFID数据流上多目标复杂事件检测

异构信息空间中实体关联关系挖掘算法CFRQ4A

BHP:面向BSP模型的负载均衡Hash图数据划分

Reverse k-ranks query

NTFS文件系统空间回收方法的研究

在线-离线数据流上复杂事件检测

基于概率SLCA的XML过滤

基于Hadoop的封闭直方图立方

Group Location Selection Queries over Uncertain Objects

Performance Evaluation of Online Backup Cloud Storage

支持大数据管理的NoSQL 系统研究综述

异构网络中关联实体识别模型及增量式验证算法研究

A unified framework for semi-supervised PU learning

Differentially private histogram publication

基于分布式的自律计算模型研究与设计

智能超市中在线与离线RFID数据仓库技术研究

基于数据差异的连续数据保护恢复算法

基于OpenFlow的虚拟网络架构的设计与实现

一种基于图结构的Web实体排序方法

一种面向情感分析的微博表情情感词典构建及应用

共享的MapReduce环境下批量作业的调度算法研究

空间数据库中主题相关区域查询

一种基于增量分区的社交网络数据管理与维护方法

Efficient mining differential co-expression bicluster in microarray datasets. Elsevier Gene

Efficient mining differential co-expression constant row bicluster in real-valued gene expression da

多标签数据挖掘技术研究综述

A Novel Approach Based on Multi-View Content Analysis and Semi-Supervised

Query intent disambiguation of keyword-based semantic entity search in dataspaces

一种有效的多数据源RFID冗余数据清洗技术

基于数据价值的云存储动态备份一致性机制

基于信息流动分析的动态社区发现方法

基于关键字语义信息的XML文档分类

<span style="color:red;font-family:宋体;font-size:12pt;"><span style="font-fam

<span style="font-family:宋体;font-size:12pt;"><span style="font-family:;"

<a class="fz14" href="http://epub.cnki.net/kns/detail/detail.aspx?QueryID=2&am

Fast Distributed Transactions and Strongly Consistent Replication for OLTP Database Systems

Marianne Winslett. Differentially private histogram publication

广告点击率估算技术综述

面向用户观点分析的多分类器集成和优化技术

一种障碍空间数据库中的连续反k近邻查询方法

图数据中Top—k属性差异q-clique查询

支持大数据管理的NoSQL系统研究综述

基于堆叠文件系统的云计算存储优化

一种基于Hadoop的多表链接策略

基于关联数据的一致性和时效性清洗方法

基于增量式分区策略的MapReduce数据均衡方法

BOD：一种高效的分布式离群点检测算法

新型OLTP数据库系统设计的关键技术及挑战

大数据环境下并行计算模型的研究进展

一种面向海量分布式数据库的嵌套查询策略

HDFS下海量小文件高效存储与索引方法

面向Web数据集成的真值发现算法

基于差分隐私的频繁序列模式挖掘算法

面向微博系统的实时个性化推荐

SERA:股票历史交易重现和分析系统

Constrained query of order-preserving submatrix in gene expression data

A Novel Approach Based on Multi-View Content Analysis and Semi- Supervised Enrichment for Movie Recommendation

异构数据联合式的真值发现算法

一种面向多源知识图谱的样例查询方法

期刊信息

《计算机与数字工程》

主管单位:中国船舶重工集团公司
主办单位:中船重工集团公司七院第七0九研究所
主编：王小非
地址：武昌74223信箱
邮编：430074
邮箱：jssg@chinajournal.net.cn
电话：027-87534308 87534205

国际标准刊号：ISSN：1672-9722
国内统一刊号：ISSN：42-1372/TP
邮发代号:

获奖情况:

国内外数据库收录:

被引量:13630