本项目拟系统研究降维在复杂多组分化学体系二维测量数据解析中的降维机理以及结果阐释,建立具有数个降维目标的、与分析化学数据特性相适应的降维方法;研究降维过程中组分化学信息的再分配以及损失情况;通过理论分析和实验数据解析,从根本上揭示降维的纯数学结果与组分的化学信息之间的内在联系,进一步提高数据解析的准确性以及结果阐释的可靠性。归纳降维方法,从无监督降维和有监督降维两个方面初步建立复杂多组分化学体系数据降维的系统框架;主张多种降维方法的联合应用,多方位地从二维测量数据中提取定性和定量信息,以在更深层次上理解复杂多组分化学体系。
Dimensionality reduction;Complex multicomponent systems;number of principal components;Open path FTIR;
设计并实现了基于向量长度的降维方法;从无监督和有监督两个方面将该降维方法应用于分析化学数据解析。该方法的降维目标与组分强度相关,因此能够在降维过程保留信号强度较大的化学组分;与经典主成分分析相互补充,可以研究数据中强度大、变化小,或者强度小、变化大的信息,进一步揭示复杂多组分体系的特征。将该降维方法与经典主成分回归分析同时用于复杂化学体系的GC-MS数据,成功地揭示了不同模型的过拟合现象,并选取了最优模型。 研究了噪声在降维过程中的分布。通过理论分析和数据验证,得出结论数据降维后,前几个主成分的噪声强度增大,而通过前几个主成分回构的数据矩阵的噪声则降低。 主因子数是降维的必要参数。本项目在主因子的估计方面取得了成果。对已有方法进行了分类整理,梳理出一类方法的数学原理,为理解这一问题以及设计新方法提供了理论指导。在此基础上,成功设计了两种估计方法。 本项目在大气红外光谱数据解析方面取得了重要进展。设计了一种方法,用于消除测量数据中的尖峰干扰,从而获得有效光谱。对大气红外光谱测量中的背景光谱进行了系统研究,弥补了一些知名机构发布的指南或者标准中缺失的信息。