3D多声源的几何分离是从阵列观测信号中同时估计源信号及其空间位置,其混合模式不同于传统的瞬时混合和卷积混合,现有的盲分离技术不适用于解决该问题,因此建立多声源的几何分离理论具有重要的科学探索价值。本项目以球麦克风阵列获取的宽频带远场声信号为研究对象,探索球面阵列的空间采样策略,建立球谐域多声源的几何分离理论。首先以空间直角坐标系三坐标轴对称为准则进行球面的空间采样,实现离散球谐函数正交性的最优逼近,为球傅里叶变换的运用提供保证;继而联合球傅里叶变换和平面波分解,建立声源频率和空间方位解耦合的球谐域信号模型,实现球谐域阵列流形矩阵的递归建模,使声源方位的估计独立于信号频率,采用张量子空间方法估计声源方位;最后建立球谐域多集联合盲源分离的混合模型和概率分布模型,联合变分贝叶斯学习方法和多集典则相关分析,分离声源信号。本项目的研究成果可应用于面向对象的音频空间编码、3D音频再现及人机交互等领域。
spherical microphone array;spherical Fourier transform;spherical harmonics domain;beamforming;geometric separation
针对球谐域3D多声源的几何分离研究,形成了一套完整的球谐域阵列信号处理方法。主要成果1) 设计了一种三线交点球麦克风阵列,该阵列关于相互正交的三条轴线都旋转对称,并且在阵列的冗余度、空间分辨率、指向性和鲁棒性方面的性能都优于等角度分布和高斯分布的球麦克风阵列,这些特性使得它在空间声源定位的应用中比其它结构的球麦克风阵列具有更优的表现。2) 利用球傅里叶变换将空域阵列信号模型转化到球谐域,比较远场和近场模态强度,分析球阵列的近场准则,分别建立远场、近场和混合场信号模型,使得声源的方位信息与频率信息解耦合,为声源个数和位置的估计奠定基础。3) 针对源信号个数估计在低快拍数和低信噪比情况下性能欠佳的问题,提出了一种基于MMSE的EEF声源个数估计方法。该方法以球谐域信号模型为基础,将观测向量分解为信号子空间和噪声子空间,利用MMSE方法估计噪声子空间的协方差矩阵,提高三维空间多声源的个数估计正确率,为声源几何分离提供保证。4) 提出了基于平面波分解的声源位置估计方法和最小方差无失真响应(MVDR)波束形成技术的声源定位算法。继而将MVDR算法扩展到球谐域中,并利用卡尔曼波束形成对该算法进行了改进。在远场定位算法的基础上,发展了混合场球ESPRIT方位估计方法和基于近场模态能量强度比的距离估计方法,准确估计三维空间多声源的位置。5) 提出了一种球谐域二次Dolph-Chebyshev波束形成方法进行空间滤波来提取声源,该方法在常规波束形成和Dolph-Chebyshev波束形成的基础上通过平方Chebyshev多项式来计算波束形成的权值。这种改进的波束形成在保证与前两者具有相同主瓣的同时,能有效地限制旁瓣,提高声场分辨率。且在低频时具有更高的白噪声增益,从而提高源信号分离的能力。