位置:成果数据库 > 期刊 > 期刊详情页
基于C0复杂度的语音端点检测技术研究
  • ISSN号:1004-1699
  • 期刊名称:《传感技术学报》
  • 时间:0
  • 分类:TN911.7[电子电信—通信与信息系统;电子电信—信息与通信工程]
  • 作者机构:[1]杭州电子科技大学智能控制与机器人研究所,杭州310018
  • 相关基金:国家自然科学基金(60302027)资助项目;浙江省教育厅科研计划(Y201018050)资助项目.
中文摘要:

针对Hilbert-Huang变换方法在语音处理过程中存在模态混叠问题,本文提出了基于小波包分解的语音时频分析方法。首先对含噪语音进行小波包分解,对各分量分别进行经验模态分解,并运用相关系数阈值准则对固有模态函数进行筛选;然后建立语音信号的Hilbert谱和瞬时能量谱;最后将基于小波包分解的HilbertHuang变换瞬时能量谱方法应用于含噪语音的端点检测。实验结果表明:与传统广义维数以及谱熵算法相比,本文方法具有更好的准确性、稳定性和自适应性,能够有效描述语音信号非线性非平稳的时频特性。

英文摘要:

To overcome the problem of mode mixing for Hilbert-Huang transform (HHT) in speech processing, a new method of time-frequency analysis based on wavelet packet decompo- sition (WPD) is proposed in this paper. Firstly, noise-corrupted speech is decomposed by u- sing WPD, each component is carried out empirical mode decomposition (EMD) separately, and the intrinsic mode function (IMF) is selected by using correlation threshold criterion. Then, the Hilbert spectrum and instantaneous energy spectrum of speech signal are achieved. Finally, the method of instantaneous energy spectrum based on WPD is applied to noise-cor- rupted speech endpoint detection. Experimental results indicate that the proposed method is more accurate, robust and self-adaptive by comparison with the original generalized dimension (OGD) and the spectral entropy(SE) algorithms. The proposed method can effectively de- scribe the time-frequency characteristics of the non-linear and non-stationary speech signal, and has provided a new idea for the research of speech signal.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《传感技术学报》
  • 北大核心期刊(2011版)
  • 主管单位:国家教育部
  • 主办单位:东南大学 中国微米纳米技术学会
  • 主编:黄庆安
  • 地址:南京市四牌楼2号
  • 邮编:210096
  • 邮箱:dzcg-bjb@163.com
  • 电话:025-83794925
  • 国际标准刊号:ISSN:1004-1699
  • 国内统一刊号:ISSN:32-1322/TN
  • 邮发代号:28-366
  • 获奖情况:
  • 2011-2012年获中国科技论文在线优秀期刊一等奖,2012年获第四届中国高校优秀科技期刊奖,2011年获中国精品科技期刊
  • 国内外数据库收录:
  • 美国化学文摘(网络版),荷兰文摘与引文数据库,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:18030