位置:成果数据库 > 期刊 > 期刊详情页
基于UBM降阶算法的高效说话人识别系统
  • ISSN号:1008-973X
  • 期刊名称:《浙江大学学报:工学版》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]浙江大学计算机科学与技术学院,浙江杭州310027
  • 相关基金:国家杰出青年基金资助项目(60525202);国家自然科学基金资助项目(60533040);教育部新世纪优秀人才计划资助项目(NCET-040545);国家“863”高技术研究发展计划资助项目(2006AA01Z136);长江学者和创新团队发展计划资助项目(IRT0652),浙江省自然科学基金资助项目(Y106705).
中文摘要:

为了提高基于高斯混合模型-通用背景模型(GMM-UBM)说话人识别系统的运算速度,提出了通用背景模型(UBM)降阶算法,该方法采用极大似然估计法训练一个高阶UBM,再采用UBM降阶算法得到低阶UBM.采用最短距离高斯分量替换空映射集合的方法解决了空映射集问题.通过实验方法分析了3种初始化低阶UBM方法的识别结果,发现不同的初始化方法对结果影响很小.在NIST2001 SRE数据库上的实验显示,该算法使基于GMM-UBM说话人识别系统的运算速度提高了8倍,而等错误率仅上升了4.59%,表明了UBM降阶算法在小幅降低系统识别率的情况下,可大幅度提高GMM-UBM系统的运行效率.

英文摘要:

A universal background model (UBM) reduction method was proposed to speed up the Gaussian mixture model-universal background model (GMM-UBM) based speaker recognition system. A high-order UBM was trained by expectation maximization (EM) algorithm and then clustered into a new UBM with lower order. The Gaussian component with the shortest distance was adopted to replace the empty set to solve the empty mapping set problem. Three methods of initialization low-order UBM were experimentally analyzed to find out that different initialization methods converged to similar recognition results. The experiments on NIST2001 SRE Corpora showed that the equal error rate (EER) of the system only increased 4.59%, while the computation speed increased by 8 times. The UBM reduction method can considerably improve the efficiency of the GMM-UBM system while maintaining the performance.

同期刊论文项目
期刊论文 46 会议论文 74 专利 11
期刊论文 38 会议论文 36 专利 32 著作 4
同项目期刊论文
期刊信息
  • 《浙江大学学报:工学版》
  • 北大核心期刊(2011版)
  • 主管单位:教育部
  • 主办单位:浙江大学
  • 主编:岑可法
  • 地址:杭州市浙大路38号
  • 邮编:310027
  • 邮箱:xbgkb@zju.edu.cn
  • 电话:0571-87952273
  • 国际标准刊号:ISSN:1008-973X
  • 国内统一刊号:ISSN:33-1245/T
  • 邮发代号:32-40
  • 获奖情况:
  • 2000年获浙江省科技期刊质量评比二等奖,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),波兰哥白尼索引,德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:21198