位置:成果数据库 > 期刊 > 期刊详情页
汉语连续语音识别系统中三音子模型的优化
  • ISSN号:1001-3695
  • 期刊名称:《计算机应用研究》
  • 时间:0
  • 分类:TN912.3[电子电信—通信与信息系统;电子电信—信息与通信工程]
  • 作者机构:[1]北京理工大学信息与电子学院,北京100081, [2]中国科学院声学研究所中国科学院语言声学与内容理解重点实验室,北京100190, [3]河北师范大学物理科学与信息工程学院,石家庄050024
  • 相关基金:国家自然科学基金资助项目(10925419,90920302,61072124,11074275,11161140319,91120001,61271426);中国科学院战略性先导科技专项资助项目(XDA06030100,XDA06030500);国家“863”计划资助项目(2012AA012503);中国科学院重点部署项目(KGZD-EW-103.2)
中文摘要:

为了更准确地估计状态聚类前有调三音子的模型参数,从而提高聚类后捆绑状态的精度及系统的识别性能,针对汉语连续语音识别中,有些有调三音子的训练样本数非常少,而其对应的无调三音子的训练样本数相对较多的情况,提出用其对应的无调三音子的模型参数进行初始化,并用最大后验概率准则训练模型。汉语大词汇量连续语音识别实验表明,该方法可以提高训练语料中稀疏三音子聚类前的模型精度,从而提高系统的识别性能。

英文摘要:

In order to estimate toned triphone' s model parameters accurately before state clustering and increase recognition rate, this paper used the corresponding toneless triphone model parameters for the initialization of toned triphones, and applied the maximum a posteriori criterion for model estimation. In the experiment of mandarin large vocabulary continuous speech recognition, this method can improve the accuracy of sparse triphone' s model in the training corpus before clustering and a- chieve certain increase of recognition rate.

同期刊论文项目
期刊论文 81 会议论文 59
期刊论文 111 会议论文 69 获奖 6
期刊论文 32 会议论文 7
同项目期刊论文
期刊信息
  • 《计算机应用研究》
  • 北大核心期刊(2011版)
  • 主管单位:四川省科学技术厅
  • 主办单位:四川省计算机研究院
  • 主编:刘营
  • 地址:成都市成科西路3号
  • 邮编:610041
  • 邮箱:arocmag@163.com
  • 电话:028-85210177 85249567
  • 国际标准刊号:ISSN:1001-3695
  • 国内统一刊号:ISSN:51-1196/TP
  • 邮发代号:62-68
  • 获奖情况:
  • 第二届国家期刊奖百种重点科技期刊,国内计算技术类重点核心期刊,国内外著名数据库收录期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:60049