位置:成果数据库 > 期刊 > 期刊详情页
基于DNN的发音偏误趋势检测
  • ISSN号:1000-0054
  • 期刊名称:《清华大学学报:自然科学版》
  • 时间:0
  • 分类:TP391.7[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术] H193.2[语言文字—汉语]
  • 作者机构:[1]北京语言大学信息科学学院,北京100083, [2]北京语言大学对外汉语研究中心,北京100083
  • 相关基金:国家自然科学基金资助项目(61175019);北京语言大学梧桐创新平台项目(16PT05)
中文摘要:

正音反馈的计算机辅助对外汉语发音训练系统已有发音偏误趋势的标注体系和基于HMM的偏误趋势检测系统。为了进一步提高系统的性能,该文应用深度神经网络进行声学建模,比较Mel频率倒谱系数(Mel-frequency cepstral coefficient,MFCC)、感知线性预测分析系数(perceptual linear predictive analysis,PLP)和Mel滤波器组系数(Mel filter bank,FBank)3种声学特征参数,并利用网格联合技术整合3种声学特征所得的候选网格。实验结果表明:DNN-HMM模型比GMM-HMM实现了更高检测正确率。针对不同发音偏误趋势,3种声学特征有不同表现,联合系统取得最高性能,最终性能为:错误拒绝率5.5%,错误接受率35.6%,检测正确率88.6%。

英文摘要:

A previous computer aided pronunciation training (CAPT) system with instructive feedback used mispronunciation tendency labeling in a GMM HMM based detection system. This system is improved here using a DNN-HMM to model the mispronunciation with comparisons of the effects of three kinds of acoustic features, tbe reel-frequency cepstral coefficient (MFCC), the perceptual linear predictive analysis (PLP) and the Mel filter bank (FBank). The lattice rescore method is also used with these three features. The results show that the DNN-HMM gives a better detection rate than the conventional approach based on the GMM-HMM. Different features behave differently in capturing the specific mispronunciation tendencies, so the integration of these three features based on the lattice rescore gives the best results with an FRR of 5.5%, FAR of 35.6%, and DA of 88.6%.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《清华大学学报:自然科学版》
  • 中国科技核心期刊
  • 主管单位:教育部
  • 主办单位:清华大学
  • 主编:梁恩忠
  • 地址:北京市海淀区清华大学学研大厦B座908
  • 邮编:100084
  • 邮箱:xuebaost@tsinghua.edn.cn
  • 电话:010-62788108 62792976
  • 国际标准刊号:ISSN:1000-0054
  • 国内统一刊号:ISSN:11-2223/N
  • 邮发代号:2-90
  • 获奖情况:
  • 国家期刊奖,国家“双高”期刊,1992年以来,历次国家级和省部级一等奖,第一、二届全国优秀科技期刊一等奖,教育部优秀期...,第三届中国出版政府奖提名奖
  • 国内外数据库收录:
  • 美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,美国应用力学评论,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:43470