位置:成果数据库 > 期刊 > 期刊详情页
基于相关距离Fisher比的混合参数用于说话人识别
  • ISSN号:1000-1239
  • 期刊名称:《计算机研究与发展》
  • 时间:0
  • 分类:TN912.34[电子电信—通信与信息系统;电子电信—信息与通信工程]
  • 作者机构:[1]桂林电子科技大学信息科技学院,广西桂林541004, [2]桂林电子科技大学电子工程与自动化学院,广西桂林541004
  • 相关基金:国家自然科学基金资助项目(61363005);国家自然科学基金资助项目(61462017);广西研究生教育创新计划资助项目(YCSZ2015152).
中文摘要:

为了得到更具区分性的特征参数,采用改进的MFCC提取方法,即低方差性的多窗谱估计MFCC,并在其基础上引入了短时TEO能量和ΔMFCC动态特征参量组合特征进行说话人识别。由于直接将两者进行组合会造成维度过高,计算复杂度增加,为此提出了相关距离Fisher比来对特征参数进行加权和维度筛选,最后送入GMM-UBM分类器模型进行识别。实验表明,改进的混合特征参数相较于单一的特征参量,具备更好的识别能力,使得识别率有一定程度的提高。

英文摘要:

In order to get more distinguished characteristic parameters, we utilize a improved multitaper MFCC extraction algorithm which with low variance. On the basis of this, we propose mixed characteristic parameters which combined short-time TEO energy with first-order MFCC that time-domain characteristics and reflecting individual voice dynamic characteristics of the speech signal separately. Due to combing the two parameters directly will result in high dimension parameters and increase the complexity of computational, for this reason, we propose a algorithm for feature selection about fisher criterion with correlation distance. Then, the speaker recognition is based on GMM-UBM classification model. ExperimentS show that the improved mixed characteristic parameter compared to single characteristic parameters has better recognition results and improving the system recognition rate.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机研究与发展》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院计算技术研究所
  • 主编:徐志伟
  • 地址:北京市科学院南路6号中科院计算所
  • 邮编:100190
  • 邮箱:crad@ict.ac.cn
  • 电话:010-62620696 62600350
  • 国际标准刊号:ISSN:1000-1239
  • 国内统一刊号:ISSN:11-1777/TP
  • 邮发代号:2-654
  • 获奖情况:
  • 2001-2007百种中国杰出学术期刊,2008中国精品科...,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,荷兰文摘与引文数据库,美国工程索引,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:40349