东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

嵌入时延网络的高斯混合背景模型说话人确认

ISSN号：1003-0530
期刊名称：《信号处理》
时间：0
分类：TN912.34[电子电信—通信与信息系统;电子电信—信息与通信工程]
作者机构：[1]东南大学信息科学与工程学院,南京210096
相关基金：国家自然科学基金（No：60872073 60472058）; 江苏省自然科学基金（No：BK2008291）资助

作者：陈存宝[1], 赵力[1]

关键词：说话人确认, 高斯混合背景模型, 时延神经网络, 嵌入, Speaker Verification, GMM-UBM, Time Delay Neural Network, Embedded

中文摘要：

本文提出了一种嵌入时延神经网络（TDNN）的高斯混合背景模型（GMM-UBM）说话人确认方法,它集成了作为判别性方法的时延神经网络和作为生成性方法的高斯混合模型各自的优点。该方法利用时延神经网络挖掘特征向量集的时序性,然后把时间信息传递给GMM;并且通过时延网络的变换使需要假设变量独立的最大似然概率（ML）方法更为合理。该方法利用极大似然概率作为训练准则,把高斯混合模型和神经网络作为整体来进行训练。训练过程中,高斯混合模型和神经网络的参数交替更新。实验结果表明,采用本文提出的方法结合TNorm比基线系统的等误差率（EER）降低28%。

英文摘要：

This paper proposes a modified Gaussian Mixed Model-Universal Background Model（GMM-UBM） with an embedded Time Delay Neural Network（TDNN）.It integrates the merits of GMM which is a generative model and TDNN as a Discriminative model. TDNN digests the time information of the feature sets,and transmits the information to GMM.Also through the transformation of the feature vectors it makes the hypothesis of variable independence that maximum likelihood needed more reasonable.We train GMM and TDNN as a whole by means of maximum likelihood.In the process of training,the parameters of GMM and TDNN are updated alternately. Experiments show that using the method with TNorm can reduce EER about 28%against baseline GMM-UBM.

同期刊论文项目

语音信号中情感特征的分析与建模

期刊论文 103 会议论文 14

汉语数字助听器语音处理核心算法研究

期刊论文 53 会议论文 4

同项目期刊论文

汉语数字助听器高频听损增强方法的实验研究

一种基于视频技术的车辆跟踪方法

联合稀疏信号恢复中的分布式路径协同优化算法

基于离散傅里叶变换和块时间递归并行格型结构的离散Gabor分析窗求解

基于改进GMM的耳语语音情感识别方法研究

基于次梯度投影的数字助听器自适应声源定位方法

基于极大似然线性回归的模型合成和特征映射进行说话人确认

针对汉语数字助听器高频听损增强方法的实验研究

符合人耳听觉特征的数字助听器子带响度补偿

基于加权次梯度投影算法的数字助听器自适应声反馈抑制

嵌入自联想神经网络的高斯混合模型说话人辨认

基于听觉仿生和压缩感知的助听器声源定位方法

基于语音信号与心电信号的多模态情感识别

基于特征空间分解与融合的语音情感识别

嵌入时延神经网络的高斯混合背景模型说话人确认

Compression and Reconstruction of Speech Signal Based on Compressed Sensing

语音压缩感知及其重构算法

Chaos synchronization of fractional order time-delay Chen system and its application in secure commu

嵌入自联想神经网络的高斯混合背景模型说话人确认

实用语音情感的特征分析与识别的研究

Impulsive Stabilization for Control and Synchronization of complex Networks with Coupling Delays

Sound Source Localization of Digital Hearing Aids Using Wavelet Based Multivariate Statistical Metho

Acoustic feedback cancellation based on weighted adaptive projection subgradient method in hearing a

一种数字助听器多通道响度补偿方法

基于分子动力学模拟的改进混合蛙跳算法

基于曲线波隐马尔可夫模型的人脸检测

多跳认知水声通信中的分布式稀疏频谱检测算法

粒子群优化小波神经网络用于碰摩声发射源定位

基于听觉感知机理的水下目标识别研究进展

嵌入时延神经网络的高斯混合模型说话人辨认

耳语音情感数据库的设计与建立

汉语降频助听算法的实验分析与改进

水声通信网络中的MACA-C介质访问控制协议

采用模型自适应的语音转换方法

越南语语音情感特征分析与识别

基于改进BP算法的中间视合成方法

基于MD-CM—SFLA神经网络的耳语音情感识别

基于CS与K-SVD的欠定盲源分离稀疏分量分析

DS/CDMA系统中基于自适应并行次梯度投影的多址干扰抑制算法

噪声环境下基于小波熵的声发射识别

认知水声通信中的分布式压缩频谱感知算法（英文）

基于海底采集多路访问—清除发送协议的水声通信介质访问控制协议

基于空间支持向量域分类器的人脸识别

水声通信网层次路由算法

基于视频的交通事件自动检测方法的研究

基于高斯混合模型的转子碰摩声发射识别方法

基于模糊熵的转子碰摩声发射信号的识别

基于能量衰减模型的转子碰摩声发射源次梯度投影定位方法

基于UKF与SIFT的车辆跟踪算法研究

数字图像形状特征提取的研究

Cooperative Compressive Spectrum Sensing in Cognitive Underw ater Acoustic Communication Networks

基于改进的多项式插值亚像素法电缆护套材料厚度测量

Speech emotion recognition bas

基于代数网络和混沌参数的碰摩声发射源定位方法研究

实用语音情感数据库的设计与研究

基于SVD分解的小波数字水印算法的研究

基于改进的蛙跳算法的神经网络在语音情感识别中的研究

基于改进Zernike矩法的电缆护套材料亚像素厚度测量

基于粒子群优化神经网络的语音情感识别

混合蛙跳算法神经网络及其在语音情感识别中的应用

基于改进的蛙跳算法与支持向量机的实用语音情感识别

基于混沌理论的碰摩声发射特征分析与源定位

基于实值离散Gabor变换的联合时频域语音增强

基于加权次梯度投影算法的数字助听器自适应声反馈抑制

基于听觉仿生和压缩感知的助听器声源定位方法

基于语音信号与心电信号的多模态情感识别

基于特征空间分解与融合的语音情感识别

语音压缩感知及其重构算法

实用语音情感的特征分析与识别的研究

噪声环境下语音分形特征的提取和

An improved algorithm for kern

Optimal Shape Space and Search

儿童情绪识别中体温与皮肤电反应

穿戴式生理参数测量仪研究及在儿

考虑性别差异的与文本无关说话人

一种改进的模糊C-均值聚类算法在

一种基于并行次梯度投影技术的加

一种利用人耳听觉特性的双声道回

一种新的利用主观听觉特性的回波

语音信号中的情感特征识别

基于基音参数规则及统计分布模型

一种基于短时谱估计和人耳掩蔽效

Facial Expression Recognition

人脸检测综述

一种改进的对齐算法及其在面部特

Face recognition using common

分数傅里叶变换域上含噪语音的联

说话人识别模型失配下的似然概率

基于MVQM的说话人识别的研究

利用人耳听觉特性的子带双声道回

基于KPCA及最佳鉴别独立分量的人

基于多窗谱的心理声学语音增强

窄带噪声下的子空间语音增强算法

一种盲信道（SIMO）语音分离技术

MIMO-OFDM系统中的空时编码技术

基于奇异值分解的分类器及在人脸

An Efficient Algorithm for Ker

较少标定点条件下的主动形状模型

基于局部二元模式算子的人脸性别

基于加权主动形状建模的人脸特征

采用归一化补偿变换的与文本无关

基于核的最进邻特征重心分类器及

Optimized Sub-band Adaptive AE

基于核鉴别共同矢量的小样人脸鉴

基于人耳隐蔽特性的宽带语音增强

基于概率DP匹配法噪声环境下的说

Foley-Sammon Optimal discrimin

Weighted maximum margin discri

Speech enhancement based on mu

基于二维偏最小二乘法的图像局部

Siren（G722.1）算法实现及DSP代

第三代移动通信中语音传输的编码

基于时间规整网络的GMM说话人识

语音识别在EWB电路基础实验教学

噪声环境下语音识别方法的研究

基于VQ和HMM的语音识别系统的性

MDCT变换在AAC中的应用

基于2维偏最小二乘法的图像局部特征提取及其在面部表情识别中的应用

耳语音情感数据库的设计与建立

基于改进的Kalman滤波的语音增强算法

基于自适应次梯度投影算法的压缩感知信号重构

Compression and reconstruction of speech signals based on compressed sensing

基于匹配追踪的弯折离散傅里叶变换

浅海水声通信中的间接自适应均衡算法

基于连续状态HMM的汉语语音识别方法

离散分数余弦变换在碰摩声发射信号降噪中的应用

耳语音的语音处理研究综述

一种新的利用主观听觉特性的回波抵消算法

基于时间规整网络的GMM说话人识别模型的初始化方法

语音识别在EWB电路基础实验教学中的应用

基于VQ和HMM的语音识别系统的性能比较

SirenTM(G722.1)算法实现及DSP代码优化

第三代移动通信中语音传输的编码技术

一种用于水声网络的改进的MAC层协议

基于移动平台的AVS—M主观视觉评价方法

GrabCut彩色图像分割算法的研究

基于BP神经网络的多传感器信息融合研究

基于状态映射的跨语种自适应研究

考虑性别差异的与文本无关说话人识别系统的实现

分数傅里叶变换域上含噪语音的联合滤波

基于改进的多项式插值亚像素法电缆护套材料厚度测量

模糊矢量量化在语音情感识别中的应用

二维主分量分析的脉内调制识别算法研究

AVS快速立体视频编码新方法

一种改进的模糊C-均值聚类算法在说话人识别中的应用

Speech emotion recognition based on statistical pitch model

噪声环境下语音分形特征的提取和分析

一种基于短时谱估计和人耳掩蔽效应的语音增强算法

期刊信息

《信号处理》
中国科技核心期刊

主管单位:中国科学技术协会
主办单位:中国电子学会
主编：谢维信
地址：北京鼓楼西大街41号
邮编：100009
邮箱：xhclfh@sohu.com
电话：010-64010656

国际标准刊号：ISSN：1003-0530
国内统一刊号：ISSN：11-2406/TN
邮发代号:80-531

获奖情况:
国家一级科技期刊

国内外数据库收录:
美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）

被引量:10219