位置:成果数据库 > 期刊 > 期刊详情页
基于实体消歧的中文实体关系抽取
  • ISSN号:1672-3961
  • 期刊名称:山东大学学报(工学版)
  • 时间:2014.11
  • 页码:32-37
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]昆明理工大学信息工程与自动化学院, [2]昆明理工大学智能信息处理重点实验室,云南昆明650500
  • 相关基金:国家自然科学基金资助项目(61262041,61472168);云南省教育厅基金重大专项资助项目(KKJD01203001);云南省科技厅重点资助项目(KKSD201303007)
  • 相关项目:专家检索资源获取与学习排序方法研究
中文摘要:

针对开放文本中中文实体关系抽取的一词多义问题,提出一种基于实体消歧的中文实体关系抽取方法。首先,从知网中挖掘出具有潜在语义关系的实体对,并利用贝叶斯分类的语义消歧方法实现从知网到维基百科的实体映射,以获取高质量的关系实例;然后,根据这些关系实例抽取出其对应文本中共现的句子实例,构建基本的抽取模式;最后通过模式合并的方法生成新模式,再使用新模式来抽取新实例。实验结果表明,该方法与没有进行语义消歧和模式合并的方法相比准确率有所提高。

英文摘要:

To solve the polysemy problem in Chinese Entity Relation Extraction in open text,a Chinese entity relation extraction method based on entity disambiguation was proposed.First,mining entity relation pairs from HowNet,and the entities were mapped from HowNet to Wikipedia by using disambiguation method based on Bayesian classification so as to obtain high-quality relationship instance;Then,extracting the sentence instances in the corresponding context with these relation instances,to construct a basic extraction pattern;Finally,extracting new cases use the new pattern.The experimental results showed that the accuracy of the proposed method was higher than the methods without semantic dis-ambiguation and pattern merging.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《山东大学学报:工学版》
  • 北大核心期刊(2011版)
  • 主管单位:教育部
  • 主办单位:山东大学
  • 主编:李术才
  • 地址:山东济南市经十路17923号
  • 邮编:250061
  • 邮箱:xbgxb@sdu.edu.cn
  • 电话:0531-88396452
  • 国际标准刊号:ISSN:1672-3961
  • 国内统一刊号:ISSN:37-1391/T
  • 邮发代号:24-221
  • 获奖情况:
  • 国内外数据库收录:
  • 美国化学文摘(网络版),波兰哥白尼索引,美国剑桥科学文摘,中国中国科技核心期刊,中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:6258