位置:成果数据库 > 期刊 > 期刊详情页
分层次的汉语功能块描述库构建分析
  • 期刊名称:陈亿、周强、宇航,分层次的汉语功能块描述库构建分析,中文信息学报﹒22(3)﹒24-31. 2008
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]语音与语言技术中心,清华大学信息科学与技术国家实验室(筹),清华大学计算机科学与技术系,北京100084
  • 相关基金:国家自然科学基金资助项目(60573185),国家高技术研究发展计划资助项目(2007AA01Z173)
  • 相关项目:基于情境的汉语基本事件内容分析研究
中文摘要:

现有功能块分析器对于不同长度和不同结构功能块的分析性能研究表明,长的结构复杂的功能块正是功能块自动分析的难点所在。由此,我们设计了新的分层次的功能块体系.并从清华句法树库TCT中自动生成了新的功能块语料库。通过对新的功能块语料库长度分布、内部结构分布分析,以及与单层次功能块语料库的相互关系的研究,我们证实了新的分层次功能块描述体系具有结构简单、长度短且分布均匀的优良特点。这些性质对功能块分析器的性能提高将会有很大的帮助。

英文摘要:

Through an experimental analysis of the relation between the length and the structure of functional chunks and the performance of the parser, this paper reveals that it is the long, complex-structured functional chunks that are the major difficulty in parsing. Therefore, this paper proposes a new hierarchical functional chunk scheme and automatically generates the new functional chunk bank from Tsinghua Chinese Tree Bank (TCT). Further extensive researches about the length and structure distribution of the new chunk bank indicates that the new functional chunks bear short length and simple structure, which will help to improve the performance of functional chunk parser.

同期刊论文项目
同项目期刊论文