采用流形学习方法挖掘流形的低维拓扑结构,是近年来数据挖掘的研究热点之一,也发展出了许多有效的流形学习方法。但是这些流形学习方法对数据噪声比较敏感,难以学习噪声数据本质的低维特征。本项目将应用数值代数和泛函分析相关理论分析局部重构权和数据噪声的关系,并以此设计快速的流形噪声数据检测方法。在此噪声数据检测方法基础上,结合半监督流形学习思想,设计鲁棒的流形学习方法。此外,本项目还将此鲁棒的流形学习方法应用于视频挖掘,结合半监督流形学习思想,并引入矩阵计算中的代数预处理方法和子空间迭代法,提高流形学习方法处理大规模数据能力和计算效率。本项目的成功实施,将对流形学习理论和方法的发展产生积极的影响,同时也为视频数据中的信息和模式挖掘提供新的工具和方法;而流形学习在视频挖掘领域的应用,也具有社会效益和广阔的市场前景。
manifold learning;noise;matrix computation;;
流形学习作为近年来数据挖掘领域的研究热点之一,对数据噪声的敏感性限制了它的发展和广泛应用。本项目从离群点检测、邻域选取、局部线性结构构造、全局重构误差模型等多个角度出发,对流形学习中的噪声敏感问题进行了深入研究。我们研究设计了快速的流形离群点检测方法,为设计鲁棒的流形学习方法提供了基础;对邻域选取这一流形学习面临的共同难题,我们提出了邻域选取的标准和一种自适应的邻域选取方法;分析LLE,LTSA等经典流形学习方法对噪声数据的敏感问题及原因,提出了构造流形稳定和鲁棒的局部线性结构的方法;提出了鲁棒的全局重构误差模型,很大的降低了流形曲率变化和数据采样不均匀对流形低维重构的影响;提出了鲁棒的半监督和无监督流形学习方法。大量模拟实验和实际实验表明,我们提出的方法能很大程度的降低经典流形学习方法对数据噪声的敏感性。此外,本项目还开展了流形学习的应用研究,改进了流形学习在手写数字识别、人脸识别、头部姿态估计等领域中的应用。