位置:立项数据库 > 立项详情页
双耳语音可懂度增强技术的研究
  • 项目名称:双耳语音可懂度增强技术的研究
  • 项目类别:面上项目
  • 批准号:11074275
  • 申请代码:A040506
  • 项目来源:国家自然科学基金
  • 研究期限:2011-01-01-2013-12-31
  • 项目负责人:李军锋
  • 负责人职称:研究员
  • 依托单位:中国科学院声学研究所
  • 批准年度:2010
中文摘要:

语音增强是语音信号处理的一个重要研究课题,具有极其广泛的应用前景。根据处理目标的不同,语音增强技术可以分为以提高语音质量为目标的增强算法和以提高语音可懂度为目标的增强算法。当前的语音增强技术对噪声抑制、提高语音质量有显著效果,但对语音可懂度的提高没有效果,甚至往往降低了语音可懂度。本项目拟提出一个基于双耳听感知机制的语音可懂度增强算法,其利用双耳信息构造空、时、频二元掩模,从而提高语音可懂度和保持双耳信息(听觉场景)。在对双耳听感知机制进行研究的基础上,我们提出基于互相关模型的空间二元掩模构建方法和基于等化-消除模型的时频二元掩模构建方法。在此基础上,构建空时频二元掩模,并应用于双耳带噪信号实现语音可懂度的增强,同时保留原有的听觉场景信息。本项目的特色和创新在于提高了语音可懂度和保留了双耳信息。研究成果可以进一步应用于先进语音通信系统、远程会议系统、双耳助听器等。

结论摘要:

语音增强是语音信号处理的一个重要研究课题,具有极其广泛的应用前景。根据处理目标的不同,语音增强技术可以分为以提高语音质量为目标的增强算法和以提高语音可懂度为目标的增强算法。当前的语音增强技术对噪声抑制、提高语音质量有显著效果,但对语音可懂度的提高没有效果,甚至往往降低了语音可懂度。本项目以双耳听觉感知机制的研究为基础,提出了两阶段双耳语音增强算法,实现了目标语音信号的增强和空间方位信息的保持;提出了目标语音信号的方位估计方法,实现了在噪声混响环境下,对目标语音信号到来方向的准确估计。调查研究了语言信息对语音增强算法的语音可懂度的影响,实验结果表明语言信息对语音增强技术有着重要的潜在影响,语音信号处理算法的设计与优化应该考虑语言本身的特性。发表了10多篇SCI/EI论文。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 32
  • 7
  • 0
  • 0
  • 0
期刊论文
相关项目
期刊论文 6 会议论文 15 获奖 6 专利 2 著作 1
期刊论文 49 会议论文 11 著作 1
李军锋的项目