位置:立项数据库 > 立项详情页
基于非平稳测度与置信权的动态选择语音识别模型
  • 项目名称:基于非平稳测度与置信权的动态选择语音识别模型
  • 项目类别:面上项目
  • 批准号:10571103
  • 申请代码:A011103
  • 项目来源:国家自然科学基金
  • 研究期限:2006-01-01-2008-12-31
  • 项目负责人:葛余博
  • 负责人职称:教授
  • 依托单位:清华大学
  • 批准年度:2005
中文摘要:

1、 计算机语音识别理论亟待突破,所期望的语音识别的稳健性和自适应能力至今没有实现,现有识别理论与系统采用统一参数模式和统一识别模型,语音的'个性'被淹没,所用参数和模型也没有刻画语音过程是平稳与不平稳过程反复交替的特点,使得在高达50维的参数空间中语音混淆严重,正识率不理想和稳健性差,候选基元几何级数增长、过重剪枝与堆栈困难也影响实时性和系统应用.本项目在探索口语语音的不平稳性量度和多元统计分析基础上,提取不平稳性参数,分类非线性时序参数,经优化压缩,动态选择更合理高效的参数模型和有适应能力的特征参数;探索状态过程控制可观测过程的系统刻画,平稳与不平稳单元间的相遇,及有关泛函理论与实现,建立有自适应能力识别模型的动态选择;进一步研究含噪语音的置信因子理论与算法,提高稳健性,完成含噪动态口语识别的理论创新和试验系统,有近95%识别率和高稳健性。本项目研究达到和超过国际先进水平。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 4
  • 2
  • 0
  • 0
  • 0
相关项目
期刊论文 17 会议论文 23
葛余博的项目