独立因子分析模型是一种集大成的子空间模型,它结合了独立元分析和因子分析等模型的优点,同时又避免了它们各自的缺点。虽然模型设计上几近完美,且吻合很多重要数据的物理模型(如功能核磁共振成像),但其算法的巨大计算复杂度却极大地限制了它的实际应用。本项目通过回顾独立元分析算法的发展历程来重新思考独立因子分析模型,进而试图从理论及算法上找到降低其计算复杂度的途径。多数独立元分析算法是基于一比特匹配定理之上的,它的存在使得算法从需要估计原信号的分布大大简化为估计信号峭度符号这一比特的信息。另一方面,独立因子分析算法的巨大计算复杂性正是源自于对原信号分布的估计,所以独立元分析算法的发展过程为独立因子分析模型提供了有益的启示,但这种启示在一比特匹配定理本身没有被证明之前是不明朗的。最近我们证明了一比特匹配定理并取得了一系列理论成果,正是这些最新的结果给独立因子分析的模型分析与算法改进提供了一条全新的思路。
one-bit-matching;independent component analysis;independent factor analysis;generative model;graph algorithm
在本项目的资助下主要完成了以下四个方面的工作测试了基于一比特匹配定理的独立因子分析(IFA)模型并总结其一般规律;在上述基础上理论分析了独立因子分析模型,并提出低复杂度的模型估计算法;理论分析了其它高阶统计项如偏度在模型中的作用,并基于此提出了一个通用的模型密度函数;应用利用独立因子分析模型构建基因调控网,同时将其模型思想引入到图匹配问题,得到较好的结果。首先,我们通过大量的仿真实验验证了OBT-IFA(One-Bit-Matching-IFA)模型,并且提出了基于EM算法的OBT-IFA的具体实现算法。实验证实了通过OBT-IFA模型能准确地估计模型的参数(混合矩阵与高斯噪声方差 ),而且相较于传统的基于高斯混合模型的MOG-IFA(Mixture of Gaussians-IFA)模型,OBT-IFA不仅能提高计算速度,而且能更好地抵抗噪声的影响。首先,我们通过大量的仿真实验验证了OBT-IFA(One-Bit-Matching-IFA)模型,并且提出了基于EM算法的OBT-IFA的具体实现算法。实验证实了通过OBT-IFA模型能准确地估计模型的参数(混合矩阵与高斯噪声方差 ),而且相较于传统的基于高斯混合模型的MOG-IFA(Mixture of Gaussians-IFA)模型,OBT-IFA不仅能提高计算速度,而且能更好地抵抗噪声的影响。再次,我们分析了其它高阶统计项譬如偏度在模型中的作用。理论上证明了偏度的使用并不需要满足一比特匹配条件,而只要求模型密度函数的偏度不为零即可。并在此基础之上提出了一个通用的模型密度函数的设计方法,以及提出了一个通用的模型密度函数。最后,利用独立因子分析模型来构建基因调控网络,得到比传统因子分析更为合理的结果;同时,将图匹配看成是一个类似独立因子分析的产生模型过程而非模型匹配过程,并基于此总结了凸凹松弛过程,可以广泛应用于解决图匹配和二次分配这些典型的组合优化问题,并实际应用于蛋白质和基因调控网络分析。基于此项目,我们在上述几个领域发表或接收了9篇学术论文,其中4篇SCI索引,7篇EI索引,包括领域内的著名期刊IEEE T-PAMI。同时,还有4篇国际期刊论文和2篇ICML2013国际会议论文处于一审或二审阶段。