近十年来,关于参数模型尤其是高维稀疏线性模型的正则化变量选择方法得到了很大的发展,然而,对于半参数模型这一大类具有广泛实际应用价值模型的变量选择方法的研究却没有得到应有的重视。本项目将研究两大类半参数统计模型的变量选择方法,一类是具有可加结构的回归模型,包括可加模型,线性可加模型,可加混合模型等等;另一类是指标模型和充分降维模型。我们将根据不同模型的特点,借鉴关于参数模型的最新研究成果,构造半参数模型的变量选择准则以及算法,研究相应估计的渐进性质和变量选择方法的相合性,探索它是否具有类似于线性模型下的Oracle性质。我们还将尝试将相应的方法推广到高维数据设置之下,即假设变量的维数随样本量的增加而增大,我们需要关注变量维数在多快的增长速度之内仍可以保证估计与推断的的有效性。这些研究是我们目前研究工作的继续。
Variable selection;additive models;goodness-of-fit;generalized linear mixed model;high dimensional data analysis
近十年来,以LASSO为代表的关于高维稀疏线性模型的正则化变量选择方法得到了极大的发展,本项目的目标是将这些新方法拓展到一些半参数统计模型中去,由于半参数模型所具有的灵活性和适用性,这种拓展十分必要。在该项目的支持下,我们取得了如下的一些成果1)对可加模型, 基于罚回归样条和群组LASSO估计,提出了一种Group-Bridge-type Spline Method的新方法,该方法可以在选择变量的同时进行罚样条回归估计并自动选择节点位置和个数,从而得到最优的非参数估计;2)利用LASSO法来估计稀疏的高维向量自回归模型,我们得到了相应估计的相合性和ORACLE性质;3)对高维的广义线性模型和变换模型提出了一种新的两阶段估计法,该方法计算简便稳健,且能自然地应用LASSO法进行变量选择;4)推广了Cai et al [11] 关于一般相依情况下高维两均值检验的结果; 5)对广义线性混合模型提出了一种基于纠偏的经验似然比的拟合优度检验,该检验保持了经验似然方法的优点且不需要计算极限方差的估计;关于上述结果的其中两篇论文已经被接受待发表。