本项目研究基于麦克风阵列的多说话人跟踪方法,它在多媒体通信、人机接口等领域有广泛应用价值。主要研究内容为(1) 应用矩阵理论中的盖氏(Gerschgorin)圆估计方法,构造信号源数的判决准则,进行说话人数目的有效估计;研究麦克风阵列的拓扑结构;(2) 应用高分辨率空间谱估计理论,根据语音信号的特点,研究多说话人的声源定位方法;(3) 应用非线性Kalman滤波技术和Bayes递推滤波技术,研究说话人跟踪的非线性滤波方法,进一步提高跟踪系统的性能;(4) 考虑到说话人运动模型的多样性,应用多传感器多目标跟踪中的数据融合算法,进行多说话人跟踪方法的研究;(5) 基于随机集合理论,研究说话人数目变化情况下的多说话人跟踪方法;(6) 在高速DSP上建立基于麦克风阵列的多说话人跟踪实时处理系统。