面向连续语音的口语发音检测方法并应用于交互式语言学习中,是目前语音信息处理研究的一个非常活跃的方向。我们将利用音素学知识和语言专家的研究,对母语是普通话的英语学习者的口语发音错误进行分析,针对发音混淆设计文本内容并采集实验语音数据,并对数据进行详细的发音质量的标注。通过建立完整的语音识别系统对英语学习者的发音进行识别,并进行音素发音准确度的评测。将音素发音的混淆规则结合到语音识别系统中,使得系统对英语学习者的混淆发音可以有效地检测出来。分析韵律单元特征(包括重音、音调和流利程度)和其它特征对非特定词汇的重音检测的影响,设计两阶段重音检测方法。在第一阶段建立非特定词的重音和轻音模型以进行重音检测,在第二阶段利用各个韵律单元特征的测度组合进行重音评测。最后,通过实验和理论分析检验所提出的方法的性能。
英文主题词mispronunciation detection;lexical detection; ASR; SVM