位置:成果数据库 > 期刊 > 期刊详情页
基于后验概率解码段模型的汉语语音数字串识别
  • ISSN号:0254-4164
  • 期刊名称:《计算机学报》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]中国科学院自动化研究所模式识别国家重点实验室,北京100080
  • 相关基金:本课题得到国家自然科学基金(60172055,60121302)、北京市自然科学基金(4042025)和国家“九七三”重点基础研究发展规划项目基金(2004CB318105)资助.
中文摘要:

通过对语音解码的分析指出了基于似然概率解码的连续语音识别的局限性,并给出了三种基于后验概率段模型(Segment Model,SM)的语音解码方法.这三种方法成功地运用于随机段模型(Stochastic Segment Model,SSM),使误识率比基线系统下降了11%;与此同时还给出了段模型的快速算法,使算法的计算复杂度降到了与隐马尔可夫模型(Hidden Markov Model,HMM)相同的数量级,满足了实用要求.

英文摘要:

The decoding algorithms of most continuous speech recognition systems are based on the likelihood score now. However, the likelihood score is only an approximate of the posterior probability and will lead to a suboptimal solution in continuous speech recognition task. In this paper, three Segment Model(SM) decoding methods based on posterior probability are introduced and successfully implemented on a Stochastic Segment Model(SSM) based system. SSM is one kind of segment models. The new decoding methods achieve 11% error rate reduction compared with the baseline system. In the meantime, a fast algorithm for SM is also proposed, which can reduce the computation complexity of the above algorithms to the same level as that of HMM and meet the requirement of real-time applications.

同期刊论文项目
期刊论文 155 会议论文 74 著作 5
同项目期刊论文
期刊信息
  • 《计算机学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国计算机学会 中国科学院计算技术研究所
  • 主编:孙凝晖
  • 地址:北京中关村科学院南路6号
  • 邮编:100190
  • 邮箱:cjc@ict.ac.cn
  • 电话:010-62620695
  • 国际标准刊号:ISSN:0254-4164
  • 国内统一刊号:ISSN:11-1826/TP
  • 邮发代号:2-833
  • 获奖情况:
  • 中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 美国数学评论(网络版),荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:48433