位置:成果数据库 > 期刊 > 期刊详情页
一种应用于文本相关说话人确认的L-向量表示和改进的余弦距离核函数
  • ISSN号:1000-5137
  • 期刊名称:《上海师范大学学报:自然科学版》
  • 时间:0
  • 分类:TP912.3[自动化与计算机技术]
  • 作者机构:[1]上海交通大学电子信息与电气工程学院,上海200240, [2]华东理工大学信息科学与工程学院,上海200237
  • 相关基金:supported by the National Natural Science Foundation of China(NSFC)under Grant(61271349;61371147;11433002); Shanghai Jiao Tong University joint research fund for Biomedical Engineering under(YG2012ZD04)
中文摘要:

提出了一种用于文本相关说说话人确认技术的i-向量提取方法和L-向量表示.一段用于注册或识别的语音可以用i-向量和L-向量联合表示.同时提出了一种改进的用于支持向量机(SVM)后端分类的核函数,改进的核函数可以同时区分说话人身份的差异和文本内容的差异.在RSR 2015语料集合1和集合2上验证系统的性能,实验结果显示改进的算法相对于传统的i-向量系统的基线能提高至多30%的识别率.

英文摘要:

A text-dependent i-vector extraction scheme and a lexicon-based binary vector( L-vector)representation are proposed to improve the performance of text-dependent speaker verification. An utterance used for enrollment or test is represented by these two vectors. An improved cosine distance kernel combining i-vector and L-vector is constructed to discriminate both speaker identity and lexical( or text) diversity with back-end support vector machine( SVM). Experiments are conducted on RSR 2015 Corpus part 1 and part 2. The results indicate that at most 30% improvement can be obtained compared with traditional i-vector baseline.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《上海师范大学学报:自然科学版》
  • 中国科技核心期刊
  • 主管单位:上海市教育委员会
  • 主办单位:上海师范大学
  • 主编:丛玉豪
  • 地址:上海市桂林路100号
  • 邮编:200234
  • 邮箱:xuebao@shnu.edu.cn
  • 电话:021-64322304
  • 国际标准刊号:ISSN:1000-5137
  • 国内统一刊号:ISSN:31-1416/C
  • 邮发代号:4-655
  • 获奖情况:
  • 2010年获教育部“中国科技论文在线优秀期刊”二等奖,2011年获中国高校科技期刊研究会第二届全国高师学...,2013年获中国高校科技期刊研究会高师学报系统的“...
  • 国内外数据库收录:
  • 德国数学文摘,中国中国科技核心期刊
  • 被引量:3487