位置:成果数据库 > 期刊 > 期刊详情页
基于排序方法的汉语句际关系树自动分析
  • ISSN号:0479-8023
  • 期刊名称:《北京大学学报:自然科学版》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]计算语言学教育部重点实验室,北京大学,北京100871, [2]网络文化与数字传播北京市重点实验室,北京信息科技大学,北京100192
  • 相关基金:国家自然科学基金(61371129); 国家重点基础研究发展计划(2014CB340504); 国家社会科学基金重大项目(12&ZD227); 网络文化与数字传播北京市重点实验室开放课题(ICDD201302)资助
中文摘要:

提出一种自动分析汉语小句级句际关系树的新方法。在修辞结构理论体系下,构建一个汉语句际关系标注语料库。不同于传统的只关心相邻两个单元的方法,提出一种类排序模型(SVM-R),自动构建汉语句际关系的树结构,旨在把握相邻3个单元之间的关联强度。实验结果表明,所提出的SVM-R模型对句际关系树的分析显著优于传统方法。最后提出并验证了丰富的、适合于汉语句际关系分析的语言特征。

英文摘要:

This paper proposes a novel method for sentence-level Chinese discourse tree building. The authors constrcut a Chinese discourse annotated corpus in the framework of Rhetorical Structure Theory, and propose a ranking-like SVM(SVM-R) model to automatically build the tree structure, which can capture the relative associated strength among three consecutive text spans rather than only two adjacent spans. The experimental results show that proposed SVM-R method significantly outperforms state-of-the-art methods in discourse parsing accuracy. It is also demonstrated that the useful features for discourse tree building are consistent with Chinese language characteristics.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《北京大学学报:自然科学版》
  • 中国科技核心期刊
  • 主管单位:教育部
  • 主办单位:北京大学
  • 主编:赵光达
  • 地址:北京海淀区海淀路52号
  • 邮编:100871
  • 邮箱:xbna@pku.edu.cn
  • 电话:010-62756706
  • 国际标准刊号:ISSN:0479-8023
  • 国内统一刊号:ISSN:11-2442/N
  • 邮发代号:2-89
  • 获奖情况:
  • 1997年第二届全国优秀科技期刊评比一等奖,1999年教育部“优秀自然科学学报一等奖”,1999年获首届国家期刊奖,中国期刊方阵“双高”期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,英国科学文摘数据库,英国动物学记录,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),英国英国皇家化学学会文摘,中国北大核心期刊(2000版)
  • 被引量:18270