随着人类基因组测序工作的完成,基因组研究的主要焦点已经转向功能研究,即需要知道这些基因是如何按照特定的组织和时间进行表达、表达量有多少,其核心是获得基因功能的表达谱。用基因芯片(CD—NA微阵列)进行表达谱检测,一次杂交可以产生成千上万个相关基因表达的定量结果。由于基因芯片技术的发展和应用,人们面对的是海量的生物信息数据,并且这种数据的增长速度极其迅速,且许多数据库是公开的,如何从这种包含序列结构和功能信息的数据中确定与某一特定生命现象(如生长、发育,肿瘤发生等)相关的基因及其功能已成为后基因组时代关注的焦点。大规模基因功能表达谱的分析导致了新的统计学方法与技术的问题,