依据最小冗余度准则,优化麦克风阵列的几何结构;根据阵列信号处理和波束形成理论,提出麦克风阵列语音增强新方法;在研究有效的时延估计方法基础上,提出声源定位的几何定位方法;在最小均方误差准则下,提出声源定位的优化方法;研究房间混响对麦克风阵列语音增强和定位系统的影响,提出去除房间混响的方法;建立一个语音增强效果好、声源定位精度高、接近实用的麦克风阵列语音增强和定位实时处理系统,并在视频会议系统中初步应用。本项目将开拓语音处理的新领域,促进麦克风阵列技术的进一步发展,具有重要理论意义和实用价值。
本项目对基于麦克风阵列的语音增强与声源定位方法进行了深入研究,主要成果有(1) 研究了基于麦克风阵列的语音增强方法,包括近场环境下的波束形成方法、子带自适应波束形成方法、基于奇异值分解的子空间方法、盲波束形成方法和基于粒子滤波的语音增强方法;(2)研究了基于盲源分离理论的多麦克风语音增强方法,针对平稳和非平稳信号,利用二阶和高阶累积量,建立了盲源分离的充分必要条件,提出了仅利用二阶统计量的盲分离算法、基于高阶累积量矩阵联合对角化的盲分离算法、基于K-L散度的频域盲分离算法;提出了基于盲源分离理论的语音加密新方法;(3)研究了基于麦克风阵列的语音声源定位方法,提出了改进的SRP-PHAT声源定位方法和基于粒子滤波的加权子空间拟合声源定位方法;(4)研究了基于麦克风阵列的语音声源跟踪方法,根据说话人的运动特点,提出了基于粒子滤波的交互式多模型说话人跟踪方法和迭代中心差分卡尔曼滤波方法;(5)给出了麦克风阵列时延估计精度的C-R界限,分析了麦克风阵列拓扑结构对其时延估计性能的影响;(6)建立了麦克风阵列语音处理系统,实现了语音增强和声源定位算法的实时处理,并实际应用于多媒体会议系统中。