位置:成果数据库 > 期刊 > 期刊详情页
面向语音增强的约束序贯高斯混合模型噪声功率谱估计
  • ISSN号:0371-0025
  • 期刊名称:《声学学报》
  • 时间:0
  • 分类:TN912.34[电子电信—通信与信息系统;电子电信—信息与通信工程]
  • 作者机构:[1]江西理工大学信息工程学院,赣州341000, [2]北京理工大学多元信息系统实验室,北京100081, [3]国家计算机网络应急技术处理协调中心,北京100029, [4]中国科学院声学研究所语言声学与内容理解重点实验室,北京100190
  • 相关基金:江西省教育厅科技项目(GJJ150681)、江西理工大学自然科学基金项目(NSFJ2015-G21)、国家重点基础研究发展计划项目(2013CB329302)、国家自然科学基金项目(61271426,10925419,90920302,61072124,11074275,11161140319,91120001)、中国科学院战略性先导科技专项(XDA06030100,XDA06030500)和中国科学院重点部署项目(KGZD-EW-103-2)资助
中文摘要:

提出了一种基于极大似然的噪声对数功率谱估计方法,采用高斯混合模型对每一个频带上的功率谱包络构建统计模型,将时序包络划分为语音和非语音类,它们分别对应于高斯混合模型的两个高斯分量,描述语音和非语音的统计分布,其中非语音高斯分量的均值即为噪声功率谱的最优估计。采用序贯学习的方法,在极大似然准则下逐帧更新模型参数,并逐帧给出噪声功率谱的最优估计值。此外,由于序贯更新过程中语音信号长时缺失,容易导致模型失稳,提出了一种在线的最小描述长度准则(MDL)来判断语音信号是否长时缺失,从而保证了模型的稳定性。实验表明,算法性能整体优于经典的MS和IMCRA算法。

英文摘要:

An approach to estimate the noise logarithmic power was presented based on maximal likelihood. The two-component Gaussian mixture model (GMM) is utilized to describe the distribution of logarithmic power of noisy speech, where one component denotes the speech ("speech+noise') power distribution and the other component denotes the non-speech power distribution. The mean of non-speech component is optimal estimate of noise power. An on-line method is presented to update the parameter set of GMM frame by frame. Due to long-term speech absence, the on- line updation may fail. An on-line minimum description length (MDL) is presented to determine the long-term speechabsence/presence, which enables the model work well under long-term speech absence. The performance of the proposedmethod is evaluated by speech enhancement. The experimental results confirm GMM algorithm outperforms the typicalmethod such as classic MS and IMCRA algorithm.

同期刊论文项目
期刊论文 32 会议论文 7
期刊论文 81 会议论文 59
期刊论文 111 会议论文 69 获奖 6
同项目期刊论文
期刊信息
  • 《声学学报》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院声学研究所
  • 主编:王小民
  • 地址:北京北四环西路21号
  • 邮编:100190
  • 邮箱:
  • 电话:010-62558329
  • 国际标准刊号:ISSN:0371-0025
  • 国内统一刊号:ISSN:11-2065/O4
  • 邮发代号:2-181
  • 获奖情况:
  • 中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,美国应用力学评论,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:8376