位置:立项数据库 > 立项详情页
基于标点信息和树形结构的汉语韵律结构研究
  • 项目名称:基于标点信息和树形结构的汉语韵律结构研究
  • 项目类别:青年科学基金项目
  • 批准号:61005053
  • 申请代码:F030509
  • 项目来源:国家自然科学基金
  • 研究期限:2011-01-01-2011-12-31
  • 项目负责人:钱揖丽
  • 负责人职称:讲师
  • 依托单位:山西大学
  • 批准年度:2010
中文摘要:

韵律在语言表达中占有重要的地位。目前,计算机自动合成语音的自然度不够理想,机器味较浓、节奏感较差,其主要缺陷就在于韵律方面。因此,研究韵律的恰当切分,正确把握话语的韵律结构,是提高计算机自动合成语音自然度的关键,也是实现人机对话和人工智能的前提,具有重大的现实意义。在国内外的相关研究中,为了得到较大规模标注了韵律结构的文本语料开展工作,人们一般都采用手工标注的方法获取。这不仅需要耗费大量的人力和时间,而且由于主要依靠主观感觉,标注过程难以规范,标注过程和结果还容易受到标注者主观知识的影响。针对上述问题,本课题探讨一种无需韵律标注语料的汉语韵律结构自动切分方法。主要研究内容包括以下几个方面利用中文文本中的标点符号信息获取韵律结构信息;利用标点符号位置模拟韵律结构边界;将线性排列的汉语句子表示为树形结构的方法;利用标点信息和树形表示结构实现韵律结构的自动预测。

结论摘要:

英文主题词punctuation marks; tree structure; prosodic structure; Chinese information processing


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 6
  • 1
  • 1
  • 0
  • 0
相关项目
期刊论文 10 会议论文 8
期刊论文 5 会议论文 2 获奖 4
期刊论文 21 会议论文 30
钱揖丽的项目