我们侧重发展贝叶斯高维数据统计方法及在高维基因组数据分析中的应用。用贝叶斯高维数据统计方法,寻找小N大p数据的精细结构,以贝叶斯观点指导数据挖掘和机器学习,发展有效的统计计算方法;在贝叶斯统计理论及蒙特卡罗计算方法中,积极开拓在高维基因组数据分析中的新领域;力争在简洁条件下,得到混合样本的Bahadur表示的收敛速度和分位数的Berry-Esseen界;研究逆矩问题及其数据分析与计算等结果,研究停时与弱鞅、N-弱鞅的关系,以期获得更多理论和应用成果;研究混合函数型数据的非参数回归函数估计,以期获得估计量的Berry-Esseen界;研究若干相依序列的大数定律、收敛速度等,并应用到较复杂的统计模型中,如非参数回归、半参数回归模型、时间序列等,以期获得相应估计量的相合性、收敛速度、渐近正态性等及其在实际中应用。同时,在具体的科研工作中,对新的问题补充跟进,力争和国内外相关研究同步。
Dependent data;Sample quantiles;Regression model;Demimartingales and N-demimartingales;Bayes estimation
在相依样本和简洁条件下,研究样本分位数估计问题,获得了类似独立样本下的Bahadur表示和Berry-Esseen界。获得了相依数据下的逆矩渐近逼近表达式及其估计量的收敛速度。对弱鞅和N弱鞅的研究过程中,利用停时等技术工具,获得了类似鞅的一些经典结论,如极大值型不等式、Doob型不等式、凹Young 函数型不等式、Marshall型不等式。在统计模型研究过程中,研究相依数据下回归模型非参数估计问题,半参数回归模型中的估计问题,线性模型M估计问题,非线性回归模型参数最小二乘估计问题,获得了有关估计量的渐近结果(如相合性、收敛速度、渐近正态性等)。研究线性回归模型中回归系数和误差方差的经验贝叶斯估计的优良性,并给出相关数据模拟与分析等结果。对生物医学数据进行无进展生存期、生存预测、预测能力等内容研究,取得的成果对许多来自生物医学等领域的数据分析问题提供了有效的解法与理论依据。已发表标注项目号11171001的论文 87 篇,其中81 篇被SCI收录,组织举办2场概率统计学术会议,培养4名博士和14名硕士,项目“相依变量的概率极限理论和统计推断理论”获2014年度安徽省科学技术奖三等奖。在科学研究、学术合作与交流、人才培养等方面取得重要成果,我们胜利地完成了原计划任务。