位置:成果数据库 > 期刊 > 期刊详情页
自然语言处理中的篇章主次关系研究
  • ISSN号:0254-4164
  • 期刊名称:《计算机学报》
  • 时间:0
  • 分类:TP18[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]苏州大学计算机科学与技术学院,江苏苏州215006, [2]苏州大学自然语言处理实验室,江苏苏州215006
  • 相关基金:国家自然科学基金(61272260); 教育部中国移动科研基金(MCM20150602); 江苏省科技计划(BK20151222)资助
中文摘要:

篇章结构分析特别是篇章主次关系研究是自然语言处理领域的一个重要研究方向.篇章主次关系的分析,有助于理解篇章的结构和语义,并为自然语言处理的应用(例如自动文摘、主题抽取和问答系统等)提供有力的支持.然而,目前篇章主次关系分析却是篇章结构分析的一个瓶颈.已有研究一般将篇章主次关系分析看作篇章修辞结构分析中的一个辅助环节,忽略了其在篇章结构分析中的重要性.因此,文中将篇章主次关系提升到篇章结构分析的核心地位,将它从篇章修辞结构分析中分离出来作为一个独立的任务进行研究.首先,探讨了什么是篇章主次关系、如何判别篇章主次关系以及为什么要研究篇章主次关系;其次,分别从两个角度(微观、宏观)和三个方面(理论体系、语料资源和计算模型)详细阐述了篇章主次关系的研究现状;再次,分析了篇章主次关系研究存在的问题,并提出我们的基本研究思路;最后,归纳出篇章主次关系未来的一些研究方向.

英文摘要:

Discourse structure analysis,especially recognizing the primary-secondary relationshipin discourse structures is an important research topic in natural language processing. Recognition of discourse primary-secondary relationship not only helps to understand the discourse structure and semantics, but also provides strong support for deep applications of natural language processing, such as summarization,topic extraction, question answering,etc. However, discourse primary secondary relationship recognition is bottleneck of discourse structure analysis in current discourse researches. Most existing research views the recognition of primary-secondary relationship as a dispensable component attached to the analysis of the rhetorical structure, totally ignoring the important role of primary-secondary relationship played in document level discourse structure analysis. Nevertheless,this paper regards the recognition of primary-secondary relationship as an independent task from the discourse rhetorical structure analysis, illustrating its critical role in discourse structure analysis. First, the paper discusses the definition of primary-secondary relationship,how to determine the primary-secondary relationship and its importance in discourse structure analysis. Second,the paper summarizes the research status of recognizing the primary-secondary relationship in discourse structure from both macro-level and micro-level, and from three aspects,i. e.,theory system, corpus resource, computing model. Moreover,this paper presents our several proposals targeting at the key issues in research on the primary-secondary relationship, Last but not least, we present several directions of future work related to the primary-secondary relationship,

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国计算机学会 中国科学院计算技术研究所
  • 主编:孙凝晖
  • 地址:北京中关村科学院南路6号
  • 邮编:100190
  • 邮箱:cjc@ict.ac.cn
  • 电话:010-62620695
  • 国际标准刊号:ISSN:0254-4164
  • 国内统一刊号:ISSN:11-1826/TP
  • 邮发代号:2-833
  • 获奖情况:
  • 中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 美国数学评论(网络版),荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:48433