位置:成果数据库 > 期刊 > 期刊详情页
大规模词表连续语音识别引擎紧致动态网络的构建
  • ISSN号:1000-0054
  • 期刊名称:清华大学学报(自然科学版)
  • 时间:2012.12.12
  • 页码:1530-1534
  • 分类:TN912.34[电子电信—通信与信息系统;电子电信—信息与通信工程]
  • 作者机构:[1]清华大学电子工程系,清华信息科学与技术国家实验室,北京100084
  • 相关基金:国家自然科学基金委员会与香港研究资助局联合科研基金资助项目(60931160443);国家自然科学基金项目(90920302,61005019);国家“八六三”高技术项目(2008AA040201);国家科技支撑计划资助项目(2009BAH41B01)
  • 相关项目:多人多方对话中的语音分离、内容分析与理解
中文摘要:

大规模词表连续语音识别系统需要综合各种知识源,如声学模型、语言模型、发音词典等。其中,解码网络是识别引擎的基础,对提高解码器的性能有着至关重要的影响。有效综合这些知识源,构建一个紧致的解码网络,可以有效减少识别时的搜索空间和重复计算,显著提高解码速度。该文针对语音识别的动态解码网络进行研究,提出了词标志(wordend,WE)节点前推算法,结合传统的前后向合并算法,实现了一个基于隐Markov模型状态为网络节点的紧凑动态解码网络。优化后的解码网络的节点数和边数分别是线性词典解码网络的1/4,是开源工具包HDecode的1/2;需要计算语言模型预测分数的节点数为HDecode的1/2。该声学模型基于三音子建模,可方便地移植到其他语种上。

英文摘要:

Large vocabulary continuous speech recognition systems (LVCSR) involve various knowledge sources, such as an acoustic model, a language model and a pronunciation dictionary. The decoder network as the basis of the decoder has a critical influence on the decoder performance. By effectively integrating these knowledge sources, a compact decoder network can reduce the search space and avoid repeated computations, which accelerates the recognition speed. This paper describes a compact dynamic decoder network based on hidden Markov model states as the network node, with an efficient word end pushing algorithm for speech recognition. The algorithm combines traditional forward and backward combination algorithms to reduce the number of nodes and edges by a factor of 4 compared to a linear lexical decoder network and with half as many nodes as the well-known open source tool HDecode. The number of nodes needed to calculate the look-ahead score is cut in half. This acoustic model is based on three phonemes so decoder networks can easily be built for other languages.

同期刊论文项目
期刊论文 111 会议论文 69 获奖 6
同项目期刊论文
期刊信息
  • 《清华大学学报:自然科学版》
  • 中国科技核心期刊
  • 主管单位:教育部
  • 主办单位:清华大学
  • 主编:梁恩忠
  • 地址:北京市海淀区清华大学学研大厦B座908
  • 邮编:100084
  • 邮箱:xuebaost@tsinghua.edn.cn
  • 电话:010-62788108 62792976
  • 国际标准刊号:ISSN:1000-0054
  • 国内统一刊号:ISSN:11-2223/N
  • 邮发代号:2-90
  • 获奖情况:
  • 国家期刊奖,国家“双高”期刊,1992年以来,历次国家级和省部级一等奖,第一、二届全国优秀科技期刊一等奖,教育部优秀期...,第三届中国出版政府奖提名奖
  • 国内外数据库收录:
  • 美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,美国应用力学评论,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:43470