位置:成果数据库 > 期刊 > 期刊详情页
嵌入时延神经网络的高斯混合模型说话人辨认
  • ISSN号:1000-3630
  • 期刊名称:《声学技术》
  • 时间:0
  • 分类:TN912.34[电子电信—通信与信息系统;电子电信—信息与通信工程]
  • 作者机构:[1]东南大学信息科学与工程学院,南京210096
  • 相关基金:国家自然科学基金(60872073 60975017); 江苏省自然科学基金(BK2008291)
中文摘要:

提出了一种在高斯混合模型中嵌入时延神经网络的方法。它集成了作为判别性方法的时延神经网络和作为生成性方法的高斯混合模型各自的优点。时延神经网络挖掘了特征向量集的时间信息,并且通过时延网络的变换使需要假设变量独立的最大似然概率(ML)方法更为合理。以最大似然概率为准则,把它们作为一个整体来进行训练。训练过程中,高斯混合模型和神经网络的参数交替更新。实验结果表明,采用所提出的模型在各种信噪比情况下的识别率都比基线系统有所提高,最高能达到21%。

英文摘要:

This paper proposes a modified Gaussian Mixed Model(GMM) with an embedded Time Delay Neural Network(TDNN).It integrates the merits of GMM which is generative and TDNN as a Discriminative model.TDNN digests the time information of the feature sets,and through the transformation of the feature vector it makes the hy-pothesis of independence that maximum likelihood needs more reasonable.GMM and TDNN are trained as a whole by means of maximum likelihood.In the process of training,the parameter of GMM and TDNN are updated alternately.Experiments show that the proposed system improves accuracy rate against baseline GMM at all SNR with a maximum to 21%.

同期刊论文项目
期刊论文 114 会议论文 7 专利 35
同项目期刊论文
期刊信息
  • 《声学技术》
  • 北大核心期刊(2014版)
  • 主管单位:中国科学院
  • 主办单位:中科院声学所东海研究站 同济大学声学研究所 上海市声学学会 上海船舶电子设备研究所
  • 主编:张叔英
  • 地址:上海市嘉定工业区新徕路399号
  • 邮编:201815
  • 邮箱:sxjs@vip.163.com
  • 电话:021-67084688-2101 64174105
  • 国际标准刊号:ISSN:1000-3630
  • 国内统一刊号:ISSN:31-1449/TB
  • 邮发代号:
  • 获奖情况:
  • 2001年在《中国学术期刊(光盘版)检索与评价数据...
  • 国内外数据库收录:
  • 波兰哥白尼索引,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2014版)
  • 被引量:5693