回归建模是研究自然科学、工程技术以及社会经济发展规律的重要工具。通过回归分析,我们就能解释一些现象,对未来的发展趋势做出预测,为我们的决策提供参考。 参数回归模型假定回归函数是已知的,然而在实际应用中,多数情况下根本不可能已知模型的具体形式。如果假定参数模型与实际相背离时,基于假定模型所做的推断其表现可能很差。在解决实际问题时,实际工作者和学者提出了变系数模型,该模型可以描述更多实际问题,比单纯的参数模型和非参数模型有更大的适应性。另外,在实际应用中,常常会收集到大量的测量误差数据、删失数据和缺失数据等一些复杂的数据集。因此,对基于各种复杂数据下的变系数模型的研究有着重要的理论意义和实用价值。本课题主要研究复杂数据下变系数模型的估计理论、模型检验以及重要变量选择问题。研究成果为变系数模型在计量经济学、生物医学等领域的应用过程中提供了有力的理论支撑和方法。
varying coefficient model;empirical likelihood;variable selection;model testing;complicated data
本项目主要在测量误差数据以及纵向数据等复杂数据下研究了变系数模型及其一些推广形式的估计、检验和变量选择等问题,提出了一系列的统计推断理论与方法。这些结果为计量经济学、生物医学和流行病学等实际领域中的统计建模提供了一个强有力的理论支持。具体地讲,本项目主要从以下三个方面展开了工作 一、研究了测量误差数据下变系数模型的统计推断问题。对测量误差数据的研究,在已有的文献中往往需要假定测量误差的协方差阵是已知的,而该假定在许多实际问题中是不能满足的。本研究成果在假定测量误差的协方差阵未知,且没有任何核实数据可以利用的情况下,对测量误差数据下变系数模型提出了一个基于工具变量的经验似然统计推断方法。另外,我们对测量误差数据下的广义变系数模型的估计问题也进行了相关研究,提出了一个基于工具变量的估计过程。 二、研究了纵向数据下变系数部分线性模型的模型检验问题。对纵向数据尽管一般假定个体之间是相互独立的,但是对每个个体内部,往往存在组内相关性。由于数据结构和模型的复杂性,经典的似然比检验往往很难给出一个有效的模型检验过程。而基于经验似然的模型检验方法有其独特的优势,因为其以经验分布作为备择假设下的分布,而未涉及任何备择假设下对模型的估计。本研究成果利用经验似然方法分别研究了模型中参数分量和非参数分量的假设检验问题。通过构造适当的辅助随机向量,保证了所构造的经验对数似然比渐近服从标准卡方分布,进而给出检验的相应拒绝域。另外,我们还利用经验似然检验方法对部分线性模型、多项式回归模型和线性工具变量模型的模型检验问题进行了研究,提出了一系列基于经验似然的模型检验方法。 三、研究了含内生协变量变系数模型的变量选择问题。结合改进的光滑门限估计方程以及工具变量技术,提出了一种基于工具变量的变量选择方法。该变量选择方法可以在进行变量选择的同时,给出重要变量回归系数的估计。并且通过引入工具变量,有效地消除了协变量的内生性对变量选择精度的影响。理论证明了所提出的变量选择方法可以相合地识别出真实模型,并且对回归系数的正则估计达到了最优的收敛速度。另外,我们还对删失数据下变系数部分线性模型的变量选择问题进行了研究,提出了一个基于经验似然的变量选择方法;对纵向数据下部分线性模型的变量选择问题进行了研究,提出了一个基于双惩罚的变量选择方法。