位置:立项数据库 > 立项详情页
基于语音知识和全局最优准则指导的段模型汉语LVCSR方法研究
  • 项目名称:基于语音知识和全局最优准则指导的段模型汉语LVCSR方法研究
  • 项目类别:面上项目
  • 批准号:60675026
  • 申请代码:F030404
  • 项目来源:国家自然科学基金
  • 研究期限:2007-01-01-2009-12-31
  • 项目负责人:刘文举
  • 负责人职称:研究员
  • 依托单位:中国科学院自动化研究所
  • 批准年度:2006
中文摘要:

深入、系统开展面向语音识别应用的汉语语音知识研究,其中包括探索最适合表征声源PF、发音方式PF和发音位置PF的汉语辅音(声母)APs特征,进而实现汉语辅音的最佳分类,并应用于汉语语音流中声学建模单元Landmarks的标定,提高段模型汉语语音识别声学建模和解码搜索的精度和效率;系统、深入研究全路径模式表征方式的全局最优准则指导的段模型汉语语音识别方法,探索出一条更准确表征语音流发音规律、优于传统优化准则的统计语音识别方法的新途径,使基于段模型语音识别方法无论是在解码搜索、还是在声学建模等方面实现大的跨越,最终的集语音知识和全局最优准则指导的段模型汉语LVCSR系统的误识率比HMM系统至少下降20%,且系统能够达到实时响应。本项研究对于探索语音识别研究的新方法具有重要的学术价值、对于开发出在公众信息服务领域(如通信、金融、娱乐、教育和互联网等)语音识别系统具有良好实用价值和广泛应用前景。

结论摘要:

英文主题词Segment model;speech recognition;speech knowledge;global optimal criterion;landmarks


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 21
  • 25
  • 3
  • 2
  • 0
会议论文
刘文举的项目