【提要】目的从统计理论角度探讨基因集分析方法,初步建立微阵列数据基因集统计分析理论框架。方法采用计算机模拟技术,比较不同原假设、理论分布生成方法在进行基因集分析时的统计学性质。结果自限性原假设方法ROC曲线下面积AUC为0.858。而竞争性原假设方法曲线下面积AUC为0.512。相同设定条件下,bootstrap方法的错误发现率(最高为0.015)低于permutation检验(最高为0.075);而permutation方法的检验效能(0.89)优于bootstrap法(0.67)。结论有效的基因集分析方法应在正确使用生物学注释基因的基础上,建立自限性原假设、采用基因表达水平标准化值构建基因集统计量并根据需求利用有效的随机化算法构建统计量的理论分布进行推断。