韵律在语言表达中占有重要的地位。目前,计算机自动合成语音的自然度不够理想,机器味较浓、节奏感较差,其主要缺陷就在于韵律方面。因此,研究韵律的恰当切分,正确把握话语的韵律结构,是提高计算机自动合成语音自然度的关键,也是实现人机对话和人工智能的前提,具有重大的现实意义。在国内外的相关研究中,为了得到较大规模标注了韵律结构的文本语料开展工作,人们一般都采用手工标注的方法获取。这不仅需要耗费大量的人力和时间,而且由于主要依靠主观感觉,标注过程难以规范,标注过程和结果还容易受到标注者主观知识的影响。针对上述问题,本课题探讨一种无需韵律标注语料的汉语韵律结构自动切分方法。主要研究内容包括以下几个方面利用中文文本中的标点符号信息获取韵律结构信息;利用标点符号位置模拟韵律结构边界;将线性排列的汉语句子表示为树形结构的方法;利用标点信息和树形表示结构实现韵律结构的自动预测。
英文主题词punctuation marks; tree structure; prosodic structure; Chinese information processing