东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

基于UBM降阶算法的高效说话人识别系统

ISSN号：1008-973X
期刊名称：《浙江大学学报：工学版》
时间：0
分类：TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]浙江大学计算机科学与技术学院,浙江杭州310027
相关基金：国家杰出青年基金资助项目（60525202）;国家自然科学基金资助项目（60533040）;教育部新世纪优秀人才计划资助项目（NCET-040545）;国家“863”高技术研究发展计划资助项目（2006AA01Z136）;长江学者和创新团队发展计划资助项目（IRT0652）,浙江省自然科学基金资助项目（Y106705）.

关键词：说话人识别, 高斯混合模型, 通用背景模型, speaker recognition, Gaussian mixture model, universal background model

中文摘要：

为了提高基于高斯混合模型-通用背景模型（GMM-UBM）说话人识别系统的运算速度,提出了通用背景模型（UBM）降阶算法,该方法采用极大似然估计法训练一个高阶UBM,再采用UBM降阶算法得到低阶UBM.采用最短距离高斯分量替换空映射集合的方法解决了空映射集问题.通过实验方法分析了3种初始化低阶UBM方法的识别结果,发现不同的初始化方法对结果影响很小.在NIST2001 SRE数据库上的实验显示,该算法使基于GMM-UBM说话人识别系统的运算速度提高了8倍,而等错误率仅上升了4.59%,表明了UBM降阶算法在小幅降低系统识别率的情况下,可大幅度提高GMM-UBM系统的运行效率.

英文摘要：

A universal background model （UBM） reduction method was proposed to speed up the Gaussian mixture model-universal background model （GMM-UBM） based speaker recognition system. A high-order UBM was trained by expectation maximization （EM） algorithm and then clustered into a new UBM with lower order. The Gaussian component with the shortest distance was adopted to replace the empty set to solve the empty mapping set problem. Three methods of initialization low-order UBM were experimentally analyzed to find out that different initialization methods converged to similar recognition results. The experiments on NIST2001 SRE Corpora showed that the equal error rate （EER） of the system only increased 4.59%, while the computation speed increased by 8 times. The UBM reduction method can considerably improve the efficiency of the GMM-UBM system while maintaining the performance.

同期刊论文项目

普适计算的关键理论与技术研究

期刊论文 46 会议论文 74 专利 11

　网络多媒体智能信息处理技术

期刊论文 51

　基于情感补偿的声纹识别技术研究

期刊论文 2

模式识别、人工智能

期刊论文 38 会议论文 36 专利 32 著作 4

同项目期刊论文

Context-Aware Workflow Management for Intelligent Navigation Applications in Pervasive Environments

A Smart Space in the Automobile

Monocular Camera-based Face Liveness Detection by Combining Eyeblink and Scene Context

A Smart Car Control Model for Brake Comfort Based on Car Following

Context-aware smart car: from model to prototype

Accelerometer-based gait recognition via voting by signature points

Towards Pervasive Instant Messaging and Presence Awareness

Adaptive location updates for mobile sinks in wireless sensor networks

Listening river: Weaving the history by stories

An adaptive context-aware transaction model for mobile and ubiquitous computing

Topology design of network-coding-based multicast networks

Assist Your Study at Home: Design, Implementation and Evaluation of the ULS System

基于多项式拟合的中性-情感模型转换算法

三维鼻形：一种新的生物特征识别模式

ScudWare: A Semantic and Adaptive Middleware Platform for Smart Vehicle Space

无线传感器网络中基于 Voronoi 图的综合维护覆盖度和连通度的混合式协议

无线传感器网络中基于临时初始密钥的密钥管理协议

Efficient group key management for mufti-privileged groups

A transactional grid workflow service for ShanghaiGrid

基于序列挖掘的Web服务推荐研究

网络化制造环境中的Web服务模糊匹配研究

基于查询重写的数据服务组合方法

数字家庭网关上网络QoS算法的研究

无线传感器网络中基于Voronoi图的覆盖和连通综合配置协议

基于带语义差别的模糊Taxonomy的交易数据库关联规则聚类

基于基频的情感语音聚类的说话人识别方法

关联且项项正相关频繁模式挖掘

三维人脸识别研究综述

基于正三角形区域划分的传感器网络覆盖与连通

ScudCORE：一个情境驱动的推理引擎

Infrastructure and Reliability Analysis of Electric Networks for E-Textiles

Static Security Optimization for Real-Time Systems

ScudCORE: 一个情境驱动的推理引擎

Enhancing Battery Efficiency for Pervasive HealthMonitoring Systems based on Electronic-Textiles

人脸识别中视频回放假冒攻击的实时检测方法

Task Follow-me: Towards Seamless Task Migration Across Smart Environments

GeeAir: A Universal Multimodal Remote Control Device for Home Appliances

Ensemble of Support Vector Machine for Text-Independent Speaker Recognition

Knowledge discovery in traditional Chinese medicine: State of the art and perspectives

驾驶ACT-R认知行为建模

智能影子 (SmartShadow) ：一个新的普适计算模型

基于 UBM 降阶算法的高效说话人识别系统

基于音频的情感语音聚类的说话人识别方法

A Dependable ESB Framework for Service Integration

Computing compatibility in dynamic service composition

Semantic web for integrated network analysis in biomedicine

RCCtrust: A Combined Trust Model for Electronic Community

情感语音变化规律的实验分析研究初步

三维鼻形：一种新的生物特征识别模式

基于带语义差别的模糊Taxonomy的交易数据库关联规则聚类

电子织物研究进展

驾驶ACT—R认知行为建模

基于基频的情感语音聚类的说话人识别方法

关联且项项正相关频繁模式挖掘

三维人脸识别研究综述

ScudCORE：一个情境驱动的推理引擎

Mismatched feature detection with finer granularity for emotional speaker recognition

计算机角色动画制作中的可视媒体融合综述

PRISMO: predictive skyline query processing over moving objects

Index and retrieve the skyline based on dominance relationship

互联网跨媒体分析与检索：理论与算法

三角形约束下的图像特征点匹配方法

多线性子空间可伸缩视频编码方法

Multiple Hypergraph Ranking for Video Concept Detection

Multiple Hypergraph Clustering of Web Images by Mining Word2Image Correlations

RCCtrust: A Combined Trust Model for Electronic Community

三维人体运动特征可视化与交互式运动分割

局部样条嵌入的正交半监督子空间学习算法

基于关键帧的三维人体运动检索

基于特征子空间学习的跨媒体检索方法

计算机视觉与机器学习技术在三维人体动画中的应用综述

一种基于内容相关性的跨媒体检索方法

计算机辅助书法牌匾设计

情景式跨媒体数字城市系统

Adaptive Indexing of Moving Objects with Highly Variable Update Frequencies

基于多模态子空间相关性传递的视频语义挖掘

跨媒体相关性推理与检索研究

基于张量表示的直推式多模态视频语义概念检测

基于改进的数据驱动决策树分析的3维人体运动检索

网格模型中直纹面的提取

基于基频的情感语音聚类的说话人识别方法

三维人脸识别研究综述

基于神经网络和遗传算法的智能夹具规划

融合时空信息的前景／阴影视频分割算法

基于轴变形的脚楦匹配方法

数据驱动的夸张动作生成

运动传感驱动的3D直观手势交互

融合手绘风格的卡通角色动画生成方法

结合动力学模拟的手绘服装动画生成

基于标记点图案的三维脚型建模与测量方法

示范表演驱动的运动数据检索方法及可用性评估

基于运动传感的书空临摹交互方式

动作与音乐的节奏特征匹配模型

基于骨架相似性的书法字检索

基于权重哈尔小波的XML包含连接估计方法

面向Web活跃用户的树型访问模式挖掘算法

一种基于容器的自组织存储模型

网络化制造环境下的产品数据版权保护方案

Local and global approaches of affinity propagation clustering for large scale data

图像-文本相关性挖掘的Web图像聚类方法

三维虚拟环境中的书法创作

一种高效的行为定向广告投放算法

基于中医药集成知识库的智能搜索

基于全局优化的图像修复及其在GPU上实现

基于构图分析的古代壁画相关度评价方法

一种面向协作标签系统的图片检索聚类方法

知识发现在古代壁画展示中的应用

期刊信息

《浙江大学学报：工学版》
北大核心期刊（2011版）

主管单位:教育部
主办单位:浙江大学
主编：岑可法
地址：杭州市浙大路38号
邮编：310027
邮箱：xbgkb@zju.edu.cn
电话：0571-87952273

国际标准刊号：ISSN：1008-973X
国内统一刊号：ISSN：33-1245/T
邮发代号:32-40

获奖情况:
2000年获浙江省科技期刊质量评比二等奖,中国期刊方阵“双效”期刊

国内外数据库收录:
俄罗斯文摘杂志,美国化学文摘（网络版）,波兰哥白尼索引,德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）

被引量:21198