位置:成果数据库 > 期刊 > 期刊详情页
基于卷积神经网络的维吾尔语语音识别
  • ISSN号:1671-0673
  • 期刊名称:《信息工程大学学报》
  • 时间:0
  • 分类:TN912.34[电子电信—通信与信息系统;电子电信—信息与通信工程]
  • 作者机构:信息工程大学,河南郑州450001
  • 相关基金:基金项目:国家自然科学基金资助项目(61175017,61673395,61403415);河南省自然科学基金资助项目(162300410331)
中文摘要:

为有效减少模型训练参数,降低维吾尔语语音识别词错误率,提出了基于卷积神经网络的维吾尔语语音识别。该方法将局部连接、权值共享以及池化有机结合,极大减少了模型训练参数。同时结合maxout和dropout算法,克服模型训练中数据稀疏的问题,进一步提高识别率。THUYG-20维吾尔语语音数据库的实验结果表明,相比传统的基于高斯混合模型隐马尔可夫模型的语音识别系统和基于深度神经网络的语音识别系统,基于卷积神经网络语音识别系统使维吾尔语语音识别错误率分别降低了15.97%和2.55%。

英文摘要:

To improve the speech recognition rate and reduce the number of parameters, the method for speech recognition based on convolutional neural network is proposed, which reduces the number of parameters by using locality connection, weight sharing and pooling jointly. Moreover, the speech recognition rate is improved by using dropout or maxout method which can solve the data sparse problem effectively. Experimental results on THUYG-20 corpus tasks show that the word error rate in Uyghur speech recognition is reduced by 15.97% and 2.55% respectively using the convolutional neural network model compared to that using the HMM-GMM and the deep neural network.

同期刊论文项目
期刊论文 85 会议论文 9 获奖 2 著作 1
同项目期刊论文
期刊信息
  • 《信息工程大学学报》
  • 主管单位:信息工程大学
  • 主办单位:信息工程大学科研部
  • 主编:郭云飞
  • 地址:郑州市科学大道62号信息工程大学科研部
  • 邮编:450001
  • 邮箱:xxgcxb@163.com
  • 电话:0371-81630446
  • 国际标准刊号:ISSN:1671-0673
  • 国内统一刊号:ISSN:41-1196/N
  • 邮发代号:
  • 获奖情况:
  • 河南省优秀学报,河南省优秀期刊,总参优秀期刊,优秀国防期刊,《CAJ-CD规范》执行优秀奖,入选中科院核心期刊,全军首批军事学核心期刊
  • 国内外数据库收录:
  • 英国科学文摘数据库
  • 被引量:2608