东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

一种应用于文本相关说话人确认的L-向量表示和改进的余弦距离核函数

ISSN号：1000-5137
期刊名称：《上海师范大学学报：自然科学版》
时间：0
分类：TP912.3[自动化与计算机技术]
作者机构：[1]上海交通大学电子信息与电气工程学院,上海200240, [2]华东理工大学信息科学与工程学院,上海200237
相关基金：supported by the National Natural Science Foundation of China（NSFC）under Grant（61271349;61371147;11433002）; Shanghai Jiao Tong University joint research fund for Biomedical Engineering under（YG2012ZD04）

作者：李为[1], 游寒旭[1], 朱杰[1], 陈宁[2]

关键词：文本相关说话人识别, i-向量, L-向量, 余弦核函数, text-dependent speaker verification, i-vector, L-vector, cosine distance kernel

中文摘要：

提出了一种用于文本相关说说话人确认技术的i-向量提取方法和L-向量表示.一段用于注册或识别的语音可以用i-向量和L-向量联合表示.同时提出了一种改进的用于支持向量机（SVM）后端分类的核函数,改进的核函数可以同时区分说话人身份的差异和文本内容的差异.在RSR 2015语料集合1和集合2上验证系统的性能,实验结果显示改进的算法相对于传统的i-向量系统的基线能提高至多30%的识别率.

英文摘要：

A text-dependent i-vector extraction scheme and a lexicon-based binary vector（ L-vector）representation are proposed to improve the performance of text-dependent speaker verification. An utterance used for enrollment or test is represented by these two vectors. An improved cosine distance kernel combining i-vector and L-vector is constructed to discriminate both speaker identity and lexical（ or text） diversity with back-end support vector machine（ SVM）. Experiments are conducted on RSR 2015 Corpus part 1 and part 2. The results indicate that at most 30% improvement can be obtained compared with traditional i-vector baseline.

同期刊论文项目

基于声信号动力学特性的相似性模型研究及在翻唱歌曲检索中的应用

期刊论文 19

低频射电天空的高精度仿真与微弱天体辐射信号的识别

期刊论文 5

高品质音频信号的变换域稀疏压缩与精准重构研究及其在移动终端中的应用

期刊论文 5

同项目期刊论文

基于改进基音跟踪算法的单通道语音分离

一种基于Bark域能量分布的噪声分类方法

基于Metaface字典学习与核稀疏表示的人脸识别方法

基于深度学习的人体行为识别算法综述

一种基于噪声分类的语音增强方法

基于计算听觉场景分析的改进清音分离方法

基于Gammachirp耳蜗能量谱特征提取的音频指纹算法

基于深度图像HOG特征的实时手势识别方法

一种有效的车辆跟踪算法与异常车辆检测

面向翻唱歌曲识别的相似度融合算法

基于HOG3D描述器与稀疏编码的异常行为检测方法

基于降噪自动编码器特征学习的音乐自动标注算法

基于交叉递归图和局部匹配的翻唱歌曲识别

基于混合判别受限波兹曼机的音乐自动标注算法

稀疏线性预测字典在语音压缩感知中的应用

一种新型多层卫星星座组网设计

基于SVM的X射线天文图像点源探测算法

含语音增强模块的i-向量说话人识别性能分析

稀疏线性预测字典在语音压缩感知中的应用

一种新型多层卫星星座组网设计

基于SVM的X射线天文图像点源探测算法

含语音增强模块的i-向量说话人识别性能分析

稀疏线性预测字典在语音压缩感知中的应用

一种新型多层卫星星座组网设计

基于SVM的X射线天文图像点源探测算法

含语音增强模块的i-向量说话人识别性能分析

期刊信息

《上海师范大学学报：自然科学版》
中国科技核心期刊

主管单位:上海市教育委员会
主办单位:上海师范大学
主编：丛玉豪
地址：上海市桂林路100号
邮编：200234
邮箱：xuebao@shnu.edu.cn
电话：021-64322304

国际标准刊号：ISSN：1000-5137
国内统一刊号：ISSN：31-1416/C
邮发代号:4-655

获奖情况:
2010年获教育部“中国科技论文在线优秀期刊”二等奖,2011年获中国高校科技期刊研究会第二届全国高师学...,2013年获中国高校科技期刊研究会高师学报系统的“...

国内外数据库收录:
德国数学文摘,中国中国科技核心期刊

被引量:3487