位置:成果数据库 > 期刊 > 期刊详情页
基于LPCC和能量熵的端点检测
  • ISSN号:1001-893X
  • 期刊名称:《电讯技术》
  • 时间:0
  • 分类:TN912.3[电子电信—通信与信息系统;电子电信—信息与通信工程]
  • 作者机构:[1]清华大学电子工程系清华信息科学与技术国家实验室,北京100084
  • 相关基金:国家自然科学基金资助项目(60572081)
中文摘要:

为提高语音端点检测系统在低信噪比下检测的准确性,提出了一种基于倒谱特征和谱熵的端点检测算法。首先,根据分析得到待测语音帧的倒谱特征量,然后计算该特征量分别在通过训练得到的语音和噪声的高斯混合模型下的似然概率,通过两者概率的比较作出有声无声初判决;联合能量熵端点检测结果得到最终判决,最后通过Hangover机制最大限度的保护了语音。实验结果表明,此方法改善了能量熵端点检测法在babble噪声下的劣势,且在不同噪声环境下均优于G.729AnnexB的性能。

英文摘要:

In order to improve the accuracy of Voice Activity Detection(VAD) in low SNR noisy environments, an algorithm based on Linear Predictive Cepstral Coefficient (LPCC) and energy entropy is proposed. First, the LPCC extracted from the input speech is imported into speech model and noise model, both of which are Gans- sian Mixture Model (GMM) separately, to calculate the likelihood ratio of speech to noise. The first-stage VAD decision is made based on the likelihood ratio. Then the spectrum entropy is applied to the second decision- making stage. Finally, a mechanism called Hangover is used to better protect the speech. Experiment results show that the new algorithm can compensate the drawbacks of spectrum entropy method in babble noisy environ- ment. Furthermore, it outperforms the G. 729 Annex B under various noisy environments.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《电讯技术》
  • 北大核心期刊(2011版)
  • 主管单位:中国电子科技集团公司
  • 主办单位:中国西南电子技术研究所
  • 主编:雷厉
  • 地址:四川省成都市金牛区营康西路85号
  • 邮编:610036
  • 邮箱:dxjs@china.com
  • 电话:028-87555632
  • 国际标准刊号:ISSN:1001-893X
  • 国内统一刊号:ISSN:51-1267/TN
  • 邮发代号:62-39
  • 获奖情况:
  • 信息产业部优秀期刊,首届《CAJ-CD规范》执行优秀期刊,工业和信息化部电子科技期刊2007~2008年度学术技...,四川省编校质量优秀奖期刊,工业和信息化部电子科技期刊2009-2010年度优秀期刊奖
  • 国内外数据库收录:
  • 波兰哥白尼索引,美国乌利希期刊指南,美国剑桥科学文摘,英国科学文摘数据库,中国中国科技核心期刊,中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:8602