位置:成果数据库 > 期刊 > 期刊详情页
基于LM算法的领域概念实体属性关系抽取
  • ISSN号:1003-0077
  • 期刊名称:中文信息学报
  • 时间:2014.11.15
  • 页码:216-222
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]昆明理工大学信息工程与自动化学院,云南昆明650500, [2]昆明理工大学智能信息处理重点实验室,云南昆明650500
  • 相关基金:国家自然科学基金(61175068);云南省教育厅基金重大专项项目(KKJ1201203001);云南省应用基础研究计划重点项目(2013FA030)
  • 相关项目:专家检索资源获取与学习排序方法研究
中文摘要:

针对非结构化自由文本中关系模式比较复杂,关系抽取性能不高的问题,该文提出了利用BP神经网络的优化算法-LM算法,对非结构化自由文本信息中的领域概念实体属性关系进行抽取.首先对语料进行预处理,然后利用CRFs模型对领域概念的实例、属性和属性值进行实体识别,然后根据领域中各类关系的特点分别进行特征提取,构造BP神经网络模型,利用LM算法抽取相应关系.和适用于二分类问题的SVM相比,人工神经网络优化算法自主学习能力强,识别精度高,更适用于多分类的问题.通过几组实验表明,该方法在领域概念实体属性关系抽取方面取得了良好的效果,F值提高了12.8%.

英文摘要:

Aimed at the problems of complex relation pattern and low relation extraction performance in the unstruc tured free text, this paper proposes an approach to extract the entity attribute relation from unstructured free text information by applying the LM optimization algorithm of BP neural network. The procedure consists ofthe corpus preprocessing, the named entity recognition (including the instance, attributes and attribute values) by CRFs mod- el, the BP neural network construction over the domain features, and the application of LM algorithm to extract cor- responding relations. Compared to SVM, the artificial neural network optimization algorithm is more suitable for multi classification problems with a higher recognition accuracy. Several groups of tests show that the method in this paper has achieved good effect in the field of entity attribute relation extraction with an improvments of 12.8% in term of F-score.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《中文信息学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国中文信息学会 中国科学院软件研究所
  • 主编:孙茂松
  • 地址:北京海淀中关村南四街4号中科院软件所
  • 邮编:100190
  • 邮箱:jcip@iscas.ac.cn
  • 电话:010-62562916
  • 国际标准刊号:ISSN:1003-0077
  • 国内统一刊号:ISSN:11-2325/N
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:9136