位置:成果数据库 > 期刊 > 期刊详情页
基于听觉感知的语音稀疏表示及压缩感知
  • ISSN号:1000-310X
  • 期刊名称:应用声学
  • 时间:0
  • 页码:-
  • 分类:TN912.3[电子电信—通信与信息系统;电子电信—信息与通信工程]
  • 作者机构:[1]西安通信学院,西安710106
  • 相关基金:国家自然科学基金项目(61072125)
  • 相关项目:基于压缩感知的语音信号建模与编码技术研究
中文摘要:

本文针对语音信号稀疏表示及压缩感知问题,将听觉感知引入稀疏系数筛选过程,用掩蔽阈值筛选重要系数,以得到更符合听觉感受的语音稀疏表示。通过对一帧浊音信号分别采用掩蔽阈值和能量阈值方法进行系数筛选对比实验,结果表明掩蔽阈值法具有更好的稀疏表示效果。为验证听觉感知对语音压缩感知性能的影响,与能量阈值法对照对测试语音进行压缩感知观测和重构,通过压缩比、信噪比、主观平均意见分等主客观指标评价其性能,结果表明,掩蔽阈值法可有效地提高压缩比且保证重构语音具有较高的主观听觉质量。

英文摘要:

This paper concerns the sparse representation and compressed sensing for speech signal, the auditory perception was brought into the selection of sparse coefficients to obtain a sparse representation which is more suitable to hearing. An experiment of sparse coefficients' selection under masking thresholds method was done comparing with the energy threshold method, the result showed the masking thresholds method was better. In order to validate the impact of the auditory perception model to compressed sensing for speech signal, the testing speeches were chosen to compress under compressed sensing framework by masking threshold method and energy threshold method, through the subjective and objective indicators, such as compression ratio, signal noise ratio and mean opinion score, a conclusion was made: the masking threshold method can lead a increasing of compression ratio while the quality of hearing for reconstructed signal is not decreased.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《应用声学》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国科学院声学研究所
  • 主编:王秀明
  • 地址:北京市海淀区北四环西路21号
  • 邮编:100190
  • 邮箱:yysx@mail.ioa.ac.cn
  • 电话:010-82547761
  • 国际标准刊号:ISSN:1000-310X
  • 国内统一刊号:ISSN:11-2121/O4
  • 邮发代号:2-561
  • 获奖情况:
  • 中国自然科学核心期刊,中国科技论文统计用刊,中国科学引文数据库来源期刊
  • 国内外数据库收录:
  • 日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:4544