位置:成果数据库 > 期刊 > 期刊详情页
多粒度特征融合的维度语音情感识别方法
  • ISSN号:1003-0530
  • 期刊名称:《信号处理》
  • 时间:0
  • 分类:TP391.42[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:哈尔滨工业大学计算机科学与技术学院,黑龙江哈尔滨150001
  • 相关基金:国家自然科学基金资助项目(61171186,61271345,61671187);深圳市基础研究项目(JCYJ20150929143955341);语言语音教育部-微软重点实验室开放基金资助项目(HIT.KLOF.20150XX,HIT.KLOF.20160xx);中央高校基本科研业务费专项资金(HIT.NSRIF.2012047)
中文摘要:

针对传统维度语音情感识别系统采用全局统计特征造成韵律学细节信息丢失以及特征演化规律缺失的问题,本文提出了一种基于不同时间单元的多粒度特征提取方法,提取了短时帧粒度、中时段粒度以及长时窗粒度特征,并提出了一种可以融合多粒度特征的基于认知机理的回馈神经网络(Cognition-Inspired Recurrent Neural Network,CIRNN)。该网络模拟了人脑处理语音信号时"循序渐进"的过程,通过融合多粒度特征,使得不同时间单元的特征均参与网络训练,既突出了情感的时序性,也保留了全局特性对情感识别的作用,实现多层级信息融合。该网络同时模拟大脑运用以往经验模式进行对比的过程,在网络中引入记忆层,用于记忆上文情感特征,强化了上下文信息对识别的影响作用。本文将该方法用于VAM维度语料库的维度情感识别,分别从Activation、Dominance、Valence三个维度进行测试,平均相关系数为0.66,识别结果明显优于传统ANN和SVR的识别结果。

英文摘要:

In order to reduce the prosodic information lacking induced by utterance-term global statistic features which were widely used by traditional speech emotion recognition,a novel multi-granularity feature extraction method is proposed in this paper. This method is based on different time units which include short-term frame features,mid-term fragments features and long-term windowing features. To fuse these multi-granularity features,we propose a cognitive-inspired recurrent neural network( Cognition-Inspired Recurrent Neural Network,CIRNN). CIRNN assembles different time-level features to simulate the human being’s step by step process on audio signals and it realizes the multi-level information fusion by highlighting both the time-sequence of emotion and the role of content information. The proposed methods are further examined on the VAM database to estimate continuous emotion primitives in a three-dimensional feature space spanned by activation,valence,and dominance and the average correlation coefficient is 0. 66. The experimental results show that,the proposed system has a significant improvement for speech emotion estimation compared with the commonly used ANN and SVR approaches.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《信号处理》
  • 中国科技核心期刊
  • 主管单位:中国科学技术协会
  • 主办单位:中国电子学会
  • 主编:谢维信
  • 地址:北京鼓楼西大街41号
  • 邮编:100009
  • 邮箱:xhclfh@sohu.com
  • 电话:010-64010656
  • 国际标准刊号:ISSN:1003-0530
  • 国内统一刊号:ISSN:11-2406/TN
  • 邮发代号:80-531
  • 获奖情况:
  • 国家一级科技期刊
  • 国内外数据库收录:
  • 美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:10219