语音情感识别是当前信号处理、模式识别、人工智能、人机交互等领域的研究热点。自然环境中的情感语音信号通常都会受到噪声的干扰,包含了不同程度的噪声。因此,对于噪声背景下的鲁棒性语音情感识别方面的研究更接近实际,更具有研究意义。本项目基于压缩感知理论开展噪声背景下的鲁棒性语音情感识别研究,主要包括(1)噪声背景下的情感语音信号的稀疏表示及重构;(2)基于压缩感知理论的稀疏判别流形学习方法;(3)面向鲁棒性语音情感识别的稀疏分类器的设计。项目的创新之处在于整合语音情感识别理论、压缩感知理论、模式识别等理论,首次提出基于压缩感知的鲁棒性语音情感识别方法,以解决噪声背景下如何有效提高语音情感识别性能的问题。本课题的研究将丰富模式识别、机器学习、情感计算等理论,为鲁棒性语音情感识别的研究提供新的解决途径,其研究思想和方法对推动和促进人机交互、人工智能、情感计算等学科的发展具有重要的科学意义。
英文主题词compressive sensing;spoken emotion recognition;manifold learning;sparse representation;feature dimensionality reduction