位置:成果数据库 > 期刊 > 期刊详情页
基于声学相关特征与词典语法相关特征的汉语重音检测
  • ISSN号:0254-4164
  • 期刊名称:《计算机学报》
  • 时间:0
  • 分类:TP319[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]山东财政学院统计与数理学院,济南250014, [2]中国科学院自动化研究所模式识别国家重点实验室,北京100190
  • 相关基金:本课题得到国家自然科学基金(90820303,60675026,90820011)、国家“八六三”高技术研究发展计划项目基金(2006010124073,2006AA012194)和国家“九七三”重点基础研究发展规划项目基金(2004CB318105)资助.
中文摘要:

重音对提高语音合成系统的自然度、可懂度以及语音识别系统的正确率等方面扮演着非常重要的作用.该文基于大规模韵律标注的语料库,利用声学相关特征及词典语法相关特征对汉语重音进行检测.采用Boosting集成分类回归树对当前音节的声学相关特征以及词典语法相关特征进行建模,Boosting集成分类回归树充分利用了当前音节的特性.同时还对词典语法相关特征采用条件随机场方法建模,条件随机场很好地利用了当前音节的上下文特性.最后,将Boosting集成分类回归树模型和条件随机场模型加权组合获得识别率更高的混合模型.该混合模型克服了Boosting集成分类回归树模型的不足,实现了Boosting集成分类回归树和条件随机场的优势互补.实验结果表明该方法具有较好的分类效果,在ASCCD语料库上能够获得84.82%重音检测正确率.同时,与之前其他人的工作在相同的条件下(相同的训练集和测试集)对比,在正确率方面,该方法分别有4.01%和1.67%的提高.另外,该文中,对英语的重音检测和汉语的重音检测做了对比,并通过特征分析方法从另一个层面验证了一些语言学上的结论.

英文摘要:

The stress is important to improve the naturalness, understandability and intelligibili ty of speech synthesis system and the correct rate of automatic speech recognition system. In this paper, we conduct stress detection by using the acoustic, lexical and syntactic features based on large scale prosodic annotation corpus. Boosting classification and regression tree is utilized to model the acoustic, lexical and syntactic features, which adequately utilizes the property of the current syllable. Conditional random fields (CRFs) are utilized to model the lexical and syntactic features, which adequately utilize the contextual property of the current syllable. The combina- tion of boosting classification and regression tree and conditional random fields achieves better classification effect when compared with boosting classification and regression tree model or conditional random fields. The combined model overcomes the efficiency of boosting classification and regression tree model, and realizes the complementarities with the advantages of boosting classification and regression tree and conditional random fields. The experimental results indicate that the proposed method acquires better classification effect, and achieves 84.82% stress detection accuracy rate on ASCCD. Compared with the previous counterpart work in the same conditions (the same training set and testing set), there are 4.01%and 1.67% improvements respectively in terms of the correct rate. In this paper, we also compare the differences and the similarities between Mandarin stress detection and English pitch accent detection. Based on the feature analysis on the large scale prosodic annotation corporus, we also verify some linguistie conclusions in a different way

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国计算机学会 中国科学院计算技术研究所
  • 主编:孙凝晖
  • 地址:北京中关村科学院南路6号
  • 邮编:100190
  • 邮箱:cjc@ict.ac.cn
  • 电话:010-62620695
  • 国际标准刊号:ISSN:0254-4164
  • 国内统一刊号:ISSN:11-1826/TP
  • 邮发代号:2-833
  • 获奖情况:
  • 中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 美国数学评论(网络版),荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:48433