位置:成果数据库 > 期刊 > 期刊详情页
一种基于区分性准则的模型结构优化方法
  • ISSN号:1003-0077
  • 期刊名称:《中文信息学报》
  • 时间:0
  • 分类:TN912.34[电子电信—通信与信息系统;电子电信—信息与通信工程]
  • 作者机构:[1]中国科学技术大学电子工程与信息科学系讯飞语音实验室,安徽合肥230027
  • 相关基金:国家自然科学基金资助项目(69975018)
中文摘要:

本文提出了一种基于区分性准则的模型结构优化方法,用以调整HMM自动语音识别系统中声学模型各状态混合高斯核成分数量的分配。通过优化选定的准则,声学模型可以在使用相同参数数量的情况下得到更好的识别性能,也可以在保持相当性能的前提下降低所需要的模型参数。相对于传统的基于似然度及复杂度惩罚的模型结构优化准则来讲,基于区分性准则的优化方法能够更直接地提高模型的区分度和鉴别力,从而得到更好的识别效果。在一个面向嵌入式系统的中文连续数字串识别任务上的实验结果证明,基于最大互信息量准则的模型结构优化能够得到比传统的、基于模型似然度及复杂度的方法更好的识别效果。

英文摘要:

This paper presents a model topology optimization method based on discriminative criterion, to adjust the kernel number of Mixture Gaussian in Hidden Markov Model (HMM) states for automatic speech recognition. With the optimized selection criterion, we can get better recognition performance with the same amount of parameters in acoustic model, or can reduce the amount of parameters while maintaining a comparable performance. Compared with conventional methods which are based on likelihood or complexity reduction algorithms, the method proposed in the paper can improve the discrimination of acoustic model more directly, and can improve the final recognition performance. Experimental results based on a continuous Chinese digital string corpus which is designed for embed- ded systems also prove that, the model topology optimization method based on discriminative criterion achieves a better performance compared with conventional, likelihood and complexity based criteria.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《中文信息学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国中文信息学会 中国科学院软件研究所
  • 主编:孙茂松
  • 地址:北京海淀中关村南四街4号中科院软件所
  • 邮编:100190
  • 邮箱:jcip@iscas.ac.cn
  • 电话:010-62562916
  • 国际标准刊号:ISSN:1003-0077
  • 国内统一刊号:ISSN:11-2325/N
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:9136