位置:成果数据库 > 期刊 > 期刊详情页
基于句法结构约束的模糊限制信息范围检测
  • ISSN号:1003-0077
  • 期刊名称:中文信息学报
  • 时间:2013.9.15
  • 页码:137-143
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]大连理工大学计算机科学与技术学院,辽宁大连116024
  • 相关基金:国家自然科学基金资助项目(61272375;61173100;61173101)
  • 相关项目:融合指代消解和迁移学习的蛋白质交互关系抽取的研究
中文摘要:

模糊限制信息检测用于区分模糊限制信息与事实信息,提高抽取信息的真实性和可靠性。模糊限制信息范围的界定具有依赖于语义和句法结构的特点,是模糊限制信息检测的一个难点。该文提出一种基于句法结构约束的模糊限制信息范围检测方法,基于依存结构树和短语结构树构建决策树,获取句法结构约束集,用于产生句法结构约束特征,并加入到条件随机域模型中进行模糊限制信息范围检测。实验采用CoNLL-2010共享任务数据集,在标准的模糊限制语标注语料上,获得了70.28%的F值,比采用普通的句法结构特征提高了4.22%。

英文摘要:

Hedge scope detection is used to distinguish factual information and uncertain information,which could improve the authenticity and reliability in information extraction.Hedge scope detection is a difficult task because of its dependency of the semantic and syntactic structures.In this paper,we propose a hedge scope detection method based on syntactic structural constraints.First,two decision trees are constructed on dependency structure and phrase structure respectively to build the syntactic constraint set.And then the hedge scope detection results based on the syntactic constraint set are used as the syntactic constraint features for Conditional Random Fields(CRF)models.Experiments on the CoNLL-2010corpus achieve the 70.28% F-score on the golden standard hedge cues,which is 4.22% higher than the system with the common syntactic construction features.

同期刊论文项目
期刊论文 50 会议论文 29 著作 1
同项目期刊论文
期刊信息
  • 《中文信息学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国中文信息学会 中国科学院软件研究所
  • 主编:孙茂松
  • 地址:北京海淀中关村南四街4号中科院软件所
  • 邮编:100190
  • 邮箱:jcip@iscas.ac.cn
  • 电话:010-62562916
  • 国际标准刊号:ISSN:1003-0077
  • 国内统一刊号:ISSN:11-2325/N
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:9136