发音错误检测是指利用计算机自动指出学习者发音中的具体错误,通常以音素发音为检测对象。项目针对基于声学特征的发音错误检测系统用于成年聋人普通话发音训练时对部分易混淆音素难以分辨的问题,以成年聋人的单音节字和多音节词语发音中的音素为研究对象,采用实验语音学中的声学分析方法,分析易混淆音素之间的分辨特征,研究利用数字信号处理技术提取基于这些分辨特征的语音学特征参数,实现对易混淆音素的准确分辨。针对声学特征和语音学特征的互补性特点,进而研究基于两种特征的融合系统,实现发音错误检测系统对各种音素发音的准确检测。项目的研究成果对于帮助成年聋人实现自主的普通话发音训练具有重要意义,对于正常人的普通话水平测试和外国人的汉语普通话发音训练方面的研究也有重要的参考价值。
pronunciation error detection;phonetic feature;Mandarin speech;the hearing-impaired people;
本项目首先研究了基于MFCC参数和GMM模型的普通话音素发音错误检测,从语音信号中提取反映声道特征信息的MFCC参数,为不同的音素建立相应的GMM模型,建立了基于声学特征参数的GOP和LLR发音错误检测系统。针对基于声学特征的发音错误检测系统用于成年聋人普通话发音训练时对部分易混淆音素难以分辨的问题,以成年聋人的单音节字和多音节词语发音中的音素为研究对象,采用实验语音学中的声学分析方法,提取了包含嗓音起始时间(VOT)信息的语音学特征参数——VOT时长比例,实现了对易混淆音素的准确分辨。项目的研究成果对于帮助成年聋人实现自主的普通话发音训练具有重要意义,对于正常人的普通话水平测试和外国人的汉语普通话发音训练方面的研究也有重要的参考价值。