位置:成果数据库 > 期刊 > 期刊详情页
基于多窗频谱估计和平滑幅度谱包络的Mel频率倒谱系数(MFCC)改进算法
  • ISSN号:1671-1815
  • 期刊名称:《科学技术与工程》
  • 时间:0
  • 分类:TN912.3[电子电信—通信与信息系统;电子电信—信息与通信工程]
  • 作者机构:[1]太原理工大学信息工程学院,太原030024
  • 相关基金:国家自然科学基金资助项目(61072087)、山西省科技攻关项目(20120313013-6)、山西省青年科技研究基金(2013021016-1)资助
中文摘要:

语音的特征提取是说话人识别系统中的关键问题.在传统的Mel频率倒谱系数(MFCC)参数的基础上,提出一种改进的MFCC特征提取算法.该算法着眼于语音的前端处理,在预处理阶段,利用SWCE窗函数,对信号进行多窗频谱估计.并对得到的频谱进行平滑处理,得到信号的谱包络.然后对信号的谱包络进行计算,得到改进的MFCC参数.实验表明,在不同噪声环境下,与传统的MFCC算法相比,改进的算法识别率提高四个百分点以上.

英文摘要:

Feature extraction of speech is a key problem in speaker recognition system.An improved MFCC feature extraction algorithm which is based on the traditional MFCC parameters was proposed,which focuses on the frontend processing.In the preprocessing stage,the SWCE window function was used to get the multiple window spectrum estimation.And the obtained spectrum was smoothed to get envelope signal.Then the spectrum envelope signal was calculated to get the improved MFCC parameters.Experiments show that in the noisy environment the recognition rate of the new algorithm,compared with the traditional MFCC algorithm,is improved more than four precent.

同期刊论文项目
期刊论文 47 会议论文 3 获奖 1 专利 1
同项目期刊论文
期刊信息
  • 《科学技术与工程》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国技术经济学会
  • 主编:明廷华
  • 地址:北京市学院南路86号
  • 邮编:100081
  • 邮箱:ste@periodicals.net.cn
  • 电话:010-62118920
  • 国际标准刊号:ISSN:1671-1815
  • 国内统一刊号:ISSN:11-4688/T
  • 邮发代号:2-734
  • 获奖情况:
  • 国内外数据库收录:
  • 中国中国科技核心期刊,中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:29478