东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

SMFCC：一种新的语音信号特征提取方法

ISSN号：1001-9081
期刊名称：《计算机应用》
时间：0
分类：TN912.34[电子电信—通信与信息系统;电子电信—信息与通信工程]
作者机构：[1]昆明理工大学信息工程与自动化学院,昆明650500, [2]昆明理工大学智能信息处理重点实验室,昆明650500
相关基金：国家自然科学基金资助项目（61262041,61472168）; 云南省自然科学基金重点项目（2013FA030）

关键词： S变换, 奇异值分解, 基于S变换的美尔倒谱系数, 高斯混合模型-通用背景模型, 说话人识别, S-transform, Singular Value Decomposition（SVD）, Mel Frequency Cepstral Coefficients based on Stransform（SMFCC）, Gaussian Mixture Model-Universal Background Model（GMM-UBM）, speaker recognition

中文摘要：

针对说话人识别系统中存在的有效语音特征提取以及噪声影响的问题,提出了一种新的语音特征提取方法——基于S变换的美尔倒谱系数（SMFCC）.该方法是在传统美尔倒谱系数（MFCC）的基础上利用S变换的二维时频多分辨率特性,以及奇异值分解（SVD）方法的二维时频矩阵有效去噪性,并结合相关统计分析方法最终获得语音特征.采用TIMIT语音数据库,将所提的特征和现有特征进行对比实验.SMFCC特征的等错误率（EER）和最小检测代价（Min DCF）均小于线性预测倒谱系数（LPCC）、MFCC及其结合方法 LMFCC,比MFCC的EER和Min DCF08分别下降了3.6%与17.9%.实验结果表明所提方法能够有效去除语音信号中的噪声,提升局部分辨率.

英文摘要：

Aiming at the problems of effective feature extraction of speech signal and influence of noise in speaker recognition, a novel method called Mel Frequency Cepstral Coefficients based on S-transform（ SMFCC） was proposed for speech feature extraction. The speech features were obtained which were based on traditional Mel Frequency Cepstral Coefficients（ MFCC）, employed the properties of two-dimensional Time-Frequency（ TF） multiresolution in S-transform and effective denoising of two-dimensional TF matrix with Singular Value Decomposition（ SVD） algorithm, and combined with other related statistic methods. Based on the TIMIT corpus, the extracted features were compared with the current features by the experiment. The Equal Error Rate（ EER） and Minimum Detection Cost Function（ Min DCF） of SMFCC were smaller than those of Linear Prediction Cepstral Coefficient（ LPCC）, MFCC, and LMFCC; especially, the EER and Min DCF08 of SMFCC were decreased by 3. 6% and 17. 9% respectively compared to MFCC. The experimental results show that the proposed method can eliminate the noise in the speech signal effectively and improve local speech signal feature resolution.

同期刊论文项目

汉越双语事件语料库构建及舆情观点挖掘方法研究

期刊论文 13

汉越双语语料库建设及词对齐方法研究

期刊论文 10

同项目期刊论文

基于深度神经网络的有色金属领域实体识别

基于实体消歧的中文实体关系抽取

融合越南语语言特征与改进PCFG的越南语短语树库构建

基于深层神经网络（DNN）的汉-越双语词语对齐方法

基于条件随机场的越南语命名实体识别方法

融合字符及字符排列特征的铭牌识别方法

基于灰色关联分析的中文新闻事件关联性识别

基于支持向量机的越语新闻文本分类方法

基于最大熵模型的越南语交叉歧义消解

基于随机游走策略的专家关系网络构建

基于Listwise的深度学习专家排序方法

基于深度神经网络的有色金属领域实体识别

基于实体消歧的中文实体关系抽取

Review expert collaborative recommendation algorithm based on topic relationship

融合结构和内容特征提取多类型网页文本要素

融合越南语语言特征与改进PCFG的越南语短语树库构建

融合字符及字符排列特征的铭牌识别方法

基于灰色关联分析的中文新闻事件关联性识别

基于最大熵模型的越南语交叉歧义消解

基于最大熵模型的英柬双语平行句对获取

期刊信息

《计算机应用》
北大核心期刊（2011版）

主管单位:四川省科学技术协会
主办单位:四川省计算机学会中国科学院成都分院
主编：张景中
地址：成都市人民南路四段九号科分院计算所
邮编：610041
邮箱：xzh@joca.cn
电话：028-85224283

国际标准刊号：ISSN：1001-9081
国内统一刊号：ISSN：51-1307/TP
邮发代号:62-110

获奖情况:
全国优秀科技期刊一等奖,国家期刊奖提名奖,中国期刊方阵双奖期刊,中文核心期刊,中国科技核心期刊

国内外数据库收录:
俄罗斯文摘杂志,波兰哥白尼索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:53679