位置:成果数据库 > 期刊 > 期刊详情页
基于卷积神经网络分类的说话人识别算法
  • ISSN号:1671-1122
  • 期刊名称:《信息网络安全》
  • 时间:0
  • 分类:TP309[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]贵州大学大数据与信息工程学院,贵州贵阳550025, [2]贵州大学智能信息处理研究所,贵州贵阳550025
  • 相关基金:国家自然科学基金[60862003]; 科技部国际合作项目[2009DFR10530]; 贵州大学研究生创新基金[2015081]
中文摘要:

由于经典的说话人识别算法都是将特征提取和模式分类分开进行的,这导致特征的选取对分类影响很大,更增加了算法的复杂度。利用卷积神经网络(CNN)的结构优势,文章提出一种基于卷积神经网络分类的说话人识别算法。算法首先对原始语音信号计算语谱图,对获得的语谱图采用卷积神经网络进行分类,分类的结果即为类别。通过真实语音库和TIMIT库测试表明,本算法取得了较高的识别率,说明这是一种有效的说话人识别方法。

英文摘要:

Feature extraction and pattern classification are two separated part in classical algorithms for speaker recognition, wherein the choice of features has much infl uence on classifi cation, and thus algorithm complexity is generally increased. In this manuscript we propose to use the structure advantage of convolutional neural network(CNN) to form a new speaker recognition algorithm. The algorithm firstly computes the spectrograms of a speech signal, then using CNN for classification. Experimental results based on self-built database and the TIMIT database show that the presented algorithm is effective in speaker recognition.

同期刊论文项目
期刊论文 16 会议论文 16 专利 3
同项目期刊论文
期刊信息
  • 《信息网络安全》
  • 主管单位:中华人民共和国公安部
  • 主办单位:公安部第三研究所 中国计算机学会 计算机安全专业委员会
  • 主编:关非
  • 地址:北京市海淀区阜成路58号新洲商务大厦301B
  • 邮编:100142
  • 邮箱:gassbj@163.com
  • 电话:010-88114408 88111078 88118778
  • 国际标准刊号:ISSN:1671-1122
  • 国内统一刊号:ISSN:31-1859/TN
  • 邮发代号:4-688
  • 获奖情况:
  • 万方,同方,维普
  • 国内外数据库收录:
  • 被引量:6058