位置:成果数据库 > 期刊 > 期刊详情页
卷积神经网络在语音识别中的应用
  • ISSN号:2095-347X
  • 期刊名称:《网络新媒体技术》
  • 时间:0
  • 分类:TP183[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]中国科学院声学研究所语言声学与内容理解重点实验室,北京100190
  • 相关基金:国家自然科学基金(编号:11161140319,91120001,61271426),中国科学院战略性先导科技专项(面向感知中国的新一代信息技术研究,编号:XDA06030100,XDA06030500),国家863计划(编号:2012AA012503),和中科院重点部署项目(编号:KGZD-EW-103-2)基金资助.
中文摘要:

研究了使用卷积神经网络构造模式分类器,并用于连续语音识别的研究。CNNs相比于广泛使用于语音识别中的深层神经网络(Deep Neural Network,DNNs),能在保证性能的同时,大大压缩模型的尺寸。在标准语音识别库TIMIT上的实验结果证明,相比传统DNN模型,CNN模型的识别性能更好,同时其模型规模和计算量都有明显降低。

英文摘要:

Convolutional Neural Networks (CNNs) are investigated for continuous speech recognitions in the paper. Compared to Deep Neural Networks (DNNs) , which have been proven to be successful in many speech recognitio.n tasks nowadays, CNNs can reduce the NN model sizes significantly, and at the same time achieve even better recognition accuracies. Experiments on standard speech corpus TIMIT showed that CNNs outperformed DNNs in accuracy.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《网络新媒体技术》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院声学研究所
  • 主编:倪宏
  • 地址:北京海淀区北四环西路21号
  • 邮编:100190
  • 邮箱:xmt@dsp.ac.cn
  • 电话:010-82547906
  • 国际标准刊号:ISSN:2095-347X
  • 国内统一刊号:ISSN:10-1055/TP
  • 邮发代号:2-304
  • 获奖情况:
  • 1990年获海洋出版社优秀期刊奖
  • 国内外数据库收录:
  • 中国中国科技核心期刊
  • 被引量:200