位置:成果数据库 > 期刊 > 期刊详情页
语料对中文名词短语指代消解影响研究
  • ISSN号:1003-0077
  • 期刊名称:中文信息学报
  • 时间:2013.5.5
  • 页码:61-68
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]苏州大学计算机科学与技术学院,江苏省计算机信息处理技术重点实验室,江苏苏州215006
  • 相关基金:国家自然科学基金资助项目(90920004,60970056,61070123,61003153);江苏省高校自然科学重大基础研究资助项目(08KJA520002)
  • 相关项目:汉语篇章衔接性分析:指代、省略及其消歧研究
中文摘要:

指代是自然语言中一种常见的语言现象,对简化语言,减少冗余有很大的作用。指代消解是用计算机找出这些指代现象的一个过程。近几年英文指代消解研究取得了很大的成就,然而,中文指代消解研究目前还较少,一方面是由于中文自然语言处理的研究起步较晚,相关的知识较少,另外一方面就是中文相关的语料库较少,目前已知的仅有ACE2005,OntoNotes等。为了探讨语料库对中文名词短语指代消解的影响,该文实现了一个基于有监督学习方法的中文名词短语指代消解平台和一个基于无监督聚类方法的中文名词短语指代消解平台,在此平台的基础上从语料库的数量和质量两个方面来探讨语料对中文名词短语指代消解的影响。

英文摘要:

Coreference is a common phenomenon in natural language, with a great effect in making the natural lan- guage clear and explicit illusions. Coreference resolution is the process to detect these phenomena by the computer. A great deal of research has been conducted on this task in English with substantial achievements in recent years. However, much less work has been done in this area in Chinese. One problem is the lack of public Chinese corpus for this research in except for ACE2005, OntoNotes and so on. To discuss the effect of the corpus to the Chinese Noun Phrase Anaphora Resolution, we present a Chinese noun phrase coreference resolution system that based on supervised learning approach and another system that based on unsupervised clustering approach. We discussed the effect of the corpus to the Chinese noun phrase coreference resolution based on the two platforms from the quantity and the quality of the corpus.

同期刊论文项目
期刊论文 26 会议论文 13 专利 6
期刊论文 25 会议论文 13 专利 1
同项目期刊论文
期刊信息
  • 《中文信息学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国中文信息学会 中国科学院软件研究所
  • 主编:孙茂松
  • 地址:北京海淀中关村南四街4号中科院软件所
  • 邮编:100190
  • 邮箱:jcip@iscas.ac.cn
  • 电话:010-62562916
  • 国际标准刊号:ISSN:1003-0077
  • 国内统一刊号:ISSN:11-2325/N
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:9136