基于非平稳测度与置信权的动态选择语音识别模型-东篱科研大数据发现系统（DRDS）

位置：立项数据库 > 立项详情页

基于非平稳测度与置信权的动态选择语音识别模型

项目名称：基于非平稳测度与置信权的动态选择语音识别模型
项目类别：面上项目
批准号：10571103
申请代码：A011103
项目来源：国家自然科学基金
研究期限：2006-01-01-2008-12-31

项目负责人：葛余博
负责人职称：教授
依托单位：清华大学
批准年度：2005

中文摘要：

1、计算机语音识别理论亟待突破，所期望的语音识别的稳健性和自适应能力至今没有实现，现有识别理论与系统采用统一参数模式和统一识别模型，语音的'个性'被淹没，所用参数和模型也没有刻画语音过程是平稳与不平稳过程反复交替的特点，使得在高达50维的参数空间中语音混淆严重，正识率不理想和稳健性差，候选基元几何级数增长、过重剪枝与堆栈困难也影响实时性和系统应用.本项目在探索口语语音的不平稳性量度和多元统计分析基础上，提取不平稳性参数，分类非线性时序参数，经优化压缩，动态选择更合理高效的参数模型和有适应能力的特征参数；探索状态过程控制可观测过程的系统刻画，平稳与不平稳单元间的相遇，及有关泛函理论与实现，建立有自适应能力识别模型的动态选择；进一步研究含噪语音的置信因子理论与算法，提高稳健性，完成含噪动态口语识别的理论创新和试验系统，有近95％识别率和高稳健性。本项目研究达到和超过国际先进水平。

中文主题词：动态选择;置信权;连续口语语音识别;非线性随机模型;积分泛函

成果综合统计

成果类型

数量

期刊论文
会议论文
专利
获奖
著作

期刊论文

State-Dependent Phoneme-Based Model Merging for Dialectal Chinese Speech Recognition

基于小数据量的方言普通话语音识别声学建模研究

Automatic Initial/Final Generation for Dialectal Chinese Speech Recognition

English Alphabet Recognition Based on Chinese Acoustic Modeling, ISCSLP, Singapore, 2006

会议论文

Feature Parameters And Confident Weights Under Noisy Environment,

Dynamic Robust Speech Recognition