由于纵向数据中混合效应模型结构特别复杂,非正态假设下似然方程不容易建立,这使得模型的估计和变量的选择问题变得十分困难。 基于Wu and Zhu (2009)提出的正交矩估计方法,首先用分位数回归方法取代最小二乘方法,给出模型中未知参数的稳健估计,提高估计的效率;其次,我们拟采用复合似然方法(Composite likelihood method)给出新的估计方法,并研究估计的渐近性质;而后给出Scad, Lasso等惩罚准则进行选变量;接着, 再深入研究样本量较少而固定效应或者随机效应的维数较大(小n大p)时,混合效应模型中随机效应和固定效应的估计和变量选择问题;最后,我们把以上研究的结果推广到半参数混合模型等。
BHEP tests;valiable selection;single index model;least square estimation;large p small n
在该项目里, 1)我们首先研究了线性混合效应模型中随机效应的正态性检验问题,基于经验特征函数建立了Baringhaus-Henze-Epps-Pulley (BHEP) 检验统计量, 采用蒙特卡洛方法模拟出检验统计量的临界值,研究了检验统计量的大样本性子,并给出小样本下的模拟结果和实际数据检验结果. 2)我们研究了带有单指标扭曲的测量误差模型的线性模型的参数估计问题,采用profile 最小二乘估计方法估计单指标,然后使用变异系数中global最小二乘估计方发估计模型中的未知参数,给出了估计的理论性质, 并给出小样本模拟结果和实际数据估计结果. 3)我们研究了部分线性单指标模型的估计和变量选择问题, 该模型中协变量不可观测,仅有相应的辅助变量的观测值. 校正了易出错的协变量之后, 我们使用profile最小二乘估计方法估计模型中的未知参数,然后采用Scad变量选择方法进行选变量,并得到了估计的oracle性质。 4)我们研究了高纬参数的变量选择问题。基于响应变量和协变量之间Kentall Tau秩相关系数提出了稳健秩相关筛选方法。和已有的方法相比, 该方法具有四个理想的优点。5)我们把部分线性单指标模型转化成双指标降维模型,以便识别线性部分和单指标部分的显著变量,采用的方法是单维数降维方法。6)我研究了响应变量和协变量都带有测量误差的非线性回归模型,提出了多元协调方法。