位置:成果数据库 > 期刊 > 期刊详情页
用于语音识别置信度的发音特征各维度分析和子集优化
  • 期刊名称:声学学报
  • 时间:0
  • 页码:339-348
  • 语言:中文
  • 分类:O236[理学—运筹学与控制论;理学—数学]
  • 作者机构:[1]中国科学院声学研究所中科信利语音实验室,北京100190
  • 相关基金:国家科技支撑计划(2008BAI50B03); 国家自然科学基金(10925419 90920302 10874203 60875014)资助项目
  • 相关项目:腭裂代偿性发音的声学特征分析、建模和客观评估方法的研究
中文摘要:

提出了基于发音特征单个维度的置信度算法,并基于此对发音特征的各个维度展开分析。分析不仅验证了融合的必要性,同时也展示了发音特征各维度之间以及和隐马尔可夫模型之间的大量冗余。为了去除冗余,提出了用子集选择的方法进行优化。对比所有都用的情况,基于发音特征紧凑子集的语音识别置信度估计,在等错率上取得了12.7%的相对下降。把经过优化后的基于发音特征的语音识别置信度估计和基于隐马尔可夫模型的语音识别置信度进行融合,在保持集内识别率不损失的前提下,显著提高了语法外输入测试的拒识性能:在相同参数下,在开发集和测试集上分别取得了34%和35.3%的显著改善。

英文摘要:

Different articulatory properties are analyzed in terms of confidence measures using a separate AF-based confidence calculation method.The analysis not only verifies the necessity of assembly,but also demonstrates a great deal of redundancies between the articulatory properties and HMM.In order to reduce the redundancy,a subset selection method is proposed.Experiments are designed to verify the above assumptions.Compared with all used together,the confidence measures based on the compact subset of articulatory features get a relative decrease of 12.7%for EER.The optimized AF-based confidence is finally combined with the HMM-based confidence,and increases rejection rate for the out of vocabulary tests with no accuracy loss of the in vocabulary tests,and the relative improvement is 34%on the development sets and 35.3%on the testing sets with the same parameters.

同期刊论文项目
期刊论文 18 会议论文 14
期刊论文 111 会议论文 69 获奖 6
期刊论文 81 会议论文 59
同项目期刊论文