东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

基于图的半监督关系抽取

ISSN号：1000-9825
期刊名称：软件学报
时间：0
页码：2843-2852
语言：中文
分类：TP18[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
作者机构：[1]厦门大学智能科学与技术系,福建厦门361005, [2]武汉大学计算机系,湖北武汉430072
相关基金：Supported by the National Natural Science Foundation of China under Grant Nos.60803078, 60773011（国家自然科学基金）
相关项目：面向开放领域的自动关系抽取技术研究

关键词：关系抽取, 基于图, 半监督学习, 标签传递, relation extraction, graph-based, semi-supervised learning, label propagation

中文摘要：

提出利用基于图的半监督学习算法，即标注传递算法，指导计算机从非结构化的文本中自动识别出实体之间的关系．该方法首先利用图策略来建立关系抽取的模型．在这个图模型中，各个有标签和未标签的样本被表示成图上的各个节点，而样本间的距离则作为图上各边的权重．然后，关系抽取的任务就转化成在这个图上估计出一个满足全局一致性假设的标注函数．通过对ACE（automatic content extraction）语料库的评测，结果显示，当只有少量的标签样本时，采用该标注传递的方法可以获得比基于SVM（support vector machine）的有监督关系抽取更好的性能。同时也明显优于基于Bootstrapping的半监督关系抽取的方法．

英文摘要：

This paper investigates a graph-based semi-supervised learning algorithm, that is, label propagation algorithm for relation extraction. Labeled and unlabeled examples are represented as the nodes, and their distances as the weights of edges in the graph. The relation extraction tries to obtain a labeling function on this graph to satisfy the global consistency assumption. Experimental results on the ACE （automatic content extraction） corpus showed that this method achieves a better performance than SVM （support vector machine） when only very few labeled examples are available, and it also performs better than bootstrapping for the relation extraction task.

同期刊论文项目

面向开放领域的自动关系抽取技术研究

期刊论文 25 会议论文 9

信息检索中的文本重排技术研究

期刊论文 13 会议论文 20

同项目期刊论文

Making intelligent business decisions by mining the implicit relation from bloggers’ posts

Improving Phrase-Based Statistical Machine Translation Models by Incorporating Syntax-Based Language

基于多特征融合的花卉图像检索

Mining user role in social community application of Web 2.0

Recognition of chinese organization name using co-training

K-Nearest neighbors relevance annotation model for distance education

基于判别模型与生成模型的层叠图像自动标注

多信息整合中文关系抽取技术研究

A two-level model for automatic image annotation

基于区域空间与词汇加权的图像自动标注

基于Co—training的图像自动标注

基于条件随机场的中医命名实体识别

基于PCM聚类算法的Blog社区发现

基于新型聚类算法IncreaseK-Means的Blog相似度分析

基于词频同现与WordNet的图像自动标注改善算法研究

Word sense learning based on feature selection and MDL principle

Evaluating Multi-Document's Content: Using Basic Element Complex Networks

基于基本要素的文摘内容连贯性评测模型

代表性博文选择的博客兴趣建模

A Behavior Mode for Content Unit Selection in Summarization, Recent Advance of Chinese Computing Tec

汉语信息检索的测试集建设

基于概率积分变换的似然比检验的预测误差推理方法

一种新的RF预失真方案的设计与仿真

多信息融合中文关系抽取技术研究

一种小型化UHF频段弯折标签天线

基于新型聚类算法Increase K-Means的Blog相似度分析

特征表示方法在中医食疗上的应用

期刊信息

《软件学报》
北大核心期刊（2011版）

主管单位:中国科学院
主办单位:中国科学院软件研究所中国计算机学会
主编：赵琛
地址：北京8718信箱中国科学院软件研究所
邮编：100190
邮箱：jos@iscas.ac.cn
电话：010-62562563

国际标准刊号：ISSN：1000-9825
国内统一刊号：ISSN：11-2560/TP
邮发代号:82-367

获奖情况:
2001年入选中国期刊方阵“双百期刊”,2000年荣获中国科学院优秀科技期刊一等奖

国内外数据库收录:
俄罗斯文摘杂志,美国数学评论（网络版）,波兰哥白尼索引,德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:54609