高维数据处理是现代统计学中重要的研究方向之一.无线电通讯、经济和语音识别等领域观测到的高维数据常包含大量噪声和少数主成分.由于维数的影响,经典的统计方法在处理这类高维数据时常得出不准确的结论.在探索这类高维数处理方法的过程中,spiked模型应运而生,模型假设样本维数与样本个数都趋于无穷,总体协方差阵有少数几个离群特征值.分析spiked模型中特征值与特征向量的性质对高维数据处理至关重要,据此可以估计和检验无线电通讯中的信号个数,经济数据中潜在的因子个数以及对基因数据进行分组等.本项目拟对spiked模型样本特征值和特征向量的性质进行研究进而对总体特征值和特征向量做出推断,以求更有效地分析和处理高维数据.
英文主题词spiked model;eigenvalue;eigenvector;sample covariance matrix;population covaraince matrix