位置:成果数据库 > 期刊 > 期刊详情页
融合领域知识短语树核函数的中文领域实体关系抽取
  • ISSN号:0469-5097
  • 期刊名称:南京大学学报(自然科学版)
  • 时间:2015.1.30
  • 页码:181-186
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]昆明理工大学信息工程与自动化学院,昆明650504, [2]昆明理工大学智能信息处理重点实验室,昆明650504
  • 相关基金:国家自然科学基金(61175068); 云南省教育厅基金重大专项项目(KKJI201203001); 云南省应用基础研究计划重点项目(2013FA030)
  • 相关项目:专家检索资源获取与学习排序方法研究
中文摘要:

针对在核函数方法中,传统短语树只包含通用领域信息难以训练出适应特定领域关系抽取模型的问题,本文提出一种融入领域知识短语树的中文领域实体关系抽取方法.基于Web上中文特定领域网站的信息结构特点,构建出能反映特定领域实体语义关系的领域知识树,并将其融合到实例句的句法树中,得到特定领域实体语义树.然后通过支持向量机训练,得到实体关系的分类模型,对特定领域实体关系进行抽取.在收集的600篇旅游领域语料上进行关系抽取实验,结果表明:本文所提出的方法优于不融入领域信息的方法,F值提高了3.4%.

英文摘要:

To solve the problem that the traditional tree kernel method is not able to train the suited model to extract entity relation in given domain,this paper proposed a method of Chinese domain entity relation extraction based on domain knowledge phrasal tree.Based on the features in web page of Chinese domain-specific website,this paper structured a domain knowledge tree which can reflect semantic information between domain entities,and fuse the information into the traditional phrasal tree.Finally,this paper obtained a classification model of entity relationship by using support vector machine to extract entity relation in given domain.Through the relation extraction experiments on collecting 600 corpuses in tourist domain,the experimental results show that the presented method is better than the traditional tree method,and the Fvalue increases 3.4%.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《南京大学学报:自然科学版》
  • 中国科技核心期刊
  • 主管单位:中华人民共和国教育部
  • 主办单位:南京大学
  • 主编:龚昌德
  • 地址:南京汉口路22号南京大学(自然科学版)编辑部
  • 邮编:210093
  • 邮箱:xbnse@netra.nju.edu.cn
  • 电话:025-83592704
  • 国际标准刊号:ISSN:0469-5097
  • 国内统一刊号:ISSN:32-1169/N
  • 邮发代号:28-25
  • 获奖情况:
  • 中国自然科学核心期刊,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:9316