本项目拟对人脸线性鉴别特征提取方法研究领域中被人们普遍忽视的某些深层次的理论与算法问题进行探索。研究目标包括初步解决特征提取方法有效性的合理度量问题,建立一个考虑了数据集、分类器、数据分割方式等因素的仿真实验规范和统计评估框架,使得不同特征提取方法的比较有一个相对客观、公平的平台;通过严密的理论推导和系统的实验比较,对本领域内有着广泛影响的一些传统观念或习惯做法的实质进行分析,找到其合理内核,舍弃其虚妄夸大的部分;澄清特征提取研究中,特别是人脸线性鉴别特征提取研究中,存在的某些模糊观点或错误认识;从理论上研究特征权对特征提取方法有效性的影响,并通过仿真试验考察特征权的实际作用;评估PCA 变换、白化变换等数据预处理方式对特征提方法有效性的影响。
linear discriminant analysis;face recognition;feature extraction;classifier;
在小样本模式识别中,为了克服“维数灾难”或使得Fisher鉴别分析等方法得以顺利实施,人们通常用主成分变换将高维样本压缩到低维主成分空间内再进行模式分类或特征提取。这就存在着如何评估主成分变换对随后的模式分类或特征提取效果的影响问题。我们对一类重要的主成分变换,即满秩主成分变换,进行了深入研究,并从理论上证明了这种变换不改变k近邻、最小距离、支持向量机、大间距线性投影、最大散度差等常用分类器的分类性能。 最近特征线、最近特征空间、k近邻单纯形、最近子空间、线性回归分类以及基于稀疏表示的分类等等都是在最近邻分类器基础上逐步发展起来的类最近邻分类器。类最近邻分类器的共同特点是用训练样本的一个线性组合来代替训练样本本身,从而大大提高样本的代表性,弥补小样本模式识别问题中原始训练样本数量极其有限的先天不足。我们就类最近邻分类器所采用的训练样本的组合方式以及进入组合的训练样本个数对类最近邻分类器分类别效果的影响两个基本问题开展了研究,并在此基础上提出了两种新的类最近邻分类器。 基于稀疏表示的分类器近年来在人脸识别等领域得到了广泛运用,取得了很多积极的研究成果。同主流人脸分类器,如最近邻、支持向量机等相比,基于稀疏表示的分类器在光照变化幅度比较大、部分有遮挡的人脸数据集上的识别率显得尤其高。美中不足的是,其计算效率极其低下。为此,我们开展了一些相关研究,并提出了一种基于近似稀疏表示的人脸识别方法。我们所做的大量仿真实验结果表明,该方法在不降低,甚至提高原方法识别率的基础上,大大提高了计算速度。 如何客观地比较不同特征提取方法的优劣,一直是人脸识别领域里一个需要加以解决的问题。困难在于,目前人们还无法从理论上比较不同特征提取算法的优劣,只能通过不太全面的仿真实验对相关算法的优劣进行说明。影响仿真实验结果的因素非常多,如数据集的选取、数据集的划分方式、分类器的选取等都会对评估结果产生影响。在实验中,应如何消除或平衡这些因素的影响?为此,我们提出了一个基于仿真实验的特征提取方法评估框架,该框架平衡了各种主要因素对实验结果的影响,使得实验结果中体现出来的差异接近不同特征提取方法鉴别能力之间存在的真正差异。我们基于此实验框架对不相关鉴别分析方法和正交鉴别分析方法进行了全面比较。 另外,我们在特征选择新方法、特征提取新算法方面也开展了一些研究。