位置:成果数据库 > 期刊 > 期刊详情页
特征空间本征音说话人自适应
  • ISSN号:0254-4156
  • 期刊名称:自动化学报
  • 时间:2015.7
  • 页码:1244-1252
  • 分类:TP[自动化与计算机技术]
  • 作者机构:[1]解放军信息工程大学信息系统工程学院,郑州450000
  • 相关基金:国家自然科学基金(61175017,61403415,61302107)资助 National Natural Science Foundation of China (61175017, 61403415, 61302107)
  • 相关项目:基于分段条件随机场的连续语音识别技术
中文摘要:

提出了特征空间本征音说话人自适应算法,该方法首先借鉴RATZ算法的思想,采用高斯混合模型对特征空间中的说话人信息进行建模;其次利用子空间方法实现对特征补偿项的估计,减少估计参数的数量,在对特征空间精确建模的同时,降低了算法对自适应数据量的需求。基于微软语料库的中文连续语音识别实验表明,该算法在自适应数据量极少时仍能取得较好的性能,配合说话人自适应训练能够进一步降低词错误率,其实时性优于本征音说话人自适应算法。

英文摘要:

A speaker adaptation method at feature level named feature-space eigenvoice adaptation method is proposed. In this method, similar to RATZ, the information of speakers in the feature space is modeled by a Gaussian mixture model. Moreover, the number of parameters to be estimated is decreased by taking the dependency of these parameters into account. This method can use very little data to construct a more accurate feature space model. Experimental results of continuous speech recognition on Microsoft speech database show that this method can still achieve good performance even when the adaptation data is limited. And speaker adaptive training based on this method can further decrease the word error rate with a superior real-time performance to that of eigenvoice methods.

同期刊论文项目
期刊论文 85 会议论文 9 获奖 2 著作 1
同项目期刊论文
期刊信息
  • 《自动化学报》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国自动化学会 中国科学院自动化研究所
  • 主编:王飞跃
  • 地址:北京东黄城根北街16号
  • 邮编:100717
  • 邮箱:aas@ia.ac.cn
  • 电话:010-64019820
  • 国际标准刊号:ISSN:0254-4156
  • 国内统一刊号:ISSN:11-2109/TP
  • 邮发代号:2-180
  • 获奖情况:
  • 1997年获全国优秀期刊奖,1985、1990、1996、2000年获中国科学院优秀期刊二等奖,2002年获国家期刊奖
  • 国内外数据库收录:
  • 美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,美国工程索引,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:27550