位置:立项数据库 > 立项详情页
基于压缩感知的语音信号建模与编码技术研究
  • 项目名称:基于压缩感知的语音信号建模与编码技术研究
  • 项目类别:面上项目
  • 批准号:61072125
  • 申请代码:F010302
  • 项目来源:国家自然科学基金
  • 研究期限:2011-01-01-2013-12-31
  • 项目负责人:陈砚圃
  • 负责人职称:教授
  • 依托单位:中国人民解放军西安通信学院
  • 批准年度:2010
中文摘要:

随着编码速率的降低,传统的语音编码模型和方法难以实现高质量语音编码。压缩感知(Compressed Sensing,CS)理论与奈奎斯特采样定理不同,具有直接信息采样特征,是对传统信号采样方法的一次新的革命,基于CS的语音信号描述和处理框架为语音编码技术研究提供了全新的思路和方法。本项目将CS理论和传统的语音编码技术相结合,研究语音信号的CS性能、基于CS的语音信号建模方法和编码技术,解决语音信号及其编码参数的稀疏变换、CS观测矩阵的构造与实现、超低速率条件下语音编码参数的高效量化、CS框架下语音信号的高质量L1优化重构等问题。在此基础上,建立一套新的语音编码方案,实现高质量中速率、低速率和超低速率语音编码,支持的编码速率从32kbps到300bps。本项目是对逼近语音编码速率极限研究的有意义探索,研究成果可用于军用短波、超短波、卫星通信等领域,具有重要的理论研究意义、军事意义和实用价值。

结论摘要:

压缩感知具有高效的信息处理能力,借助其实现语音压缩编码就成为了一种新方法的探索。为使压缩感知与语音信号更好地结合发挥其在压缩编码上的优势,项目主要从三个大的方面展开研究工作1、语音稀疏表示方法研究。主要研究了稀疏性度量指标、语音稀疏化途径及相应的几种稀疏表示手段。研究发现语音信号可以进行稀疏表示,具备利用压缩感知进行处理的条件,同时,受稀疏表示手段等诸多因素的影响,实际效果不尽相同,目前的语音稀疏化水平还有待进一步提升。2、压缩感知处理语音的模型研究。主要围绕对语音信号的观测和重构问题结合非均匀采样理论提出了一种非均匀观测方法,并有针对性地给出了一种重构流程。在此基础上,还论证了非均匀采样与压缩感知之间的异同,通过实验数据分析认为非均匀采样与压缩感知在语音信号信息获取能力上效果相当,而且非均匀采样在实用性方面更具有优势。此外,还针对语音传输和存储两种应用背景分别提出了语音压缩感知框架。3、压缩感知在语音编码中的应用研究。围绕如何降低编码速率的问题,从语音观测数据的高效量化编码出发,分别利用标量量化和分裂矢量量化方法进行编码,结果表明矢量量化方法要明显优于标量量化方法,在16kbps的中速率语音编码上基本可用,但语音质量并不是很好。为进一步降低编码速率,构建了语音编码参数的压缩感知方法,结合相关参数编码技术在低速率和极低速率语音编码上进行了仿真实验,结果表明低编码速率下语音质量较差,仅可作为语音编码的一种方法,而不足以取代现有编码技术。在以上研究工作的基础上,最后总结了研究中的一些经验,并指出了存在的问题,在此基础上,指出了还有待更深入进行研究的几个问题及对应思路。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 10
  • 3
  • 0
  • 0
  • 0
相关项目
期刊论文 75 会议论文 35 专利 1
期刊论文 23 会议论文 2 专利 2 著作 1
陈砚圃的项目