近年来,随着各种生物检测技术的发展,医学研究中出现了各种高通量数据,如基因组、蛋白质组和代谢组学数据等,变量选择是生物标志物识别和建立分类模型的重要环节,由于高维组学数据中的绝大多数变量对分类并不起作用,并且存在多重共线性、模型过拟合等问题,传统的基于最小二乘方法估计的线性回归并不适用于高维数据。