现代科技的发展需要处理大量高维的和有相关性的数据,尤其是在有缺失数据,不规则取样数据,稀疏数据等情况下,如何处理这些数据,传统的多元统计分析方法面临严峻的挑战。在科研的很多前沿领域,函数型数据分析方法已经开始取代传统方法,并结合能够跟随时间或空间变化的动态模型,逐渐成为分析高维数据和高维信号的强有力手段。目前的函数型数据模型主要是基于函数型主成分分析的线性模型,本项研究将致力于建立具有普遍意义的高维数据的函数型非线性模型,改进现有的线性模型,发挥其在处理缺失数据,不规则取样数据和稀疏数据中的优势,对信号数据的变动情况提供科学合理的解释。在充分拓展模型的同时,本研究还将结合时空分析(temporal-spatial analysis)和多层模型(multi-level model),致力于将非线性函数型数据方法推广至更广泛的应用领域,诸如生物学,医学,环境科学,工程学,经济学和金融学等。
functional data;high dimensional data;functional nonlinear model;functional PCA;
本项目按预定目标探索了函数型数据研究的各个发展方向,建立了若干实用的函数型数据模型,并改进了数据深度的概念,提出了函数性数据的排序,检验等新方法。方法主要应用于生命科学、医学等领域。本项目已发表标注受本项目资助的SCI论文三篇,中国科技核心期刊一篇。目前修改后又投递论文一篇,另有两篇在投。项目负责人已编写成熟与发表文章相关的软件包,并应国内外一些大学的学者(如英国剑桥大学,美国哥伦比亚大学,中国科学技术大学等)的要求发给他们继续进行研究。在本项目的研究中,申请者与上海交通大学医学院、美国National Institute of Statistical Sciences、上海财经大学统计与管理学院以及中国科学院神经科学研究所等进行了合作,开拓了研究的广度与深度,并与各单位建立了良好的合作关系。本项目共培养七位硕士研究生,其中四位已毕业,在制药公司、银行等机构继续从事应用性研究方面的工作,三位仍然在读。