基因芯片中存在大量重复检测的探针序列, 包括代表基因的同一特征序列的多次检测和代表基因的不同序列片段的检测。对基因表达谱中不同重复检测探针检测值的处理方法对基于基因芯片数据的后续分析(对癌症等复杂疾病的分型与机理研究、疾病相关特征基因发现与功能预测等)有重要的影响。为此,本课题研究不同的重复检测探针的处理方法对各种后续分析的影响,包括(1)分析对应同一个基因的一组检测探针之间的表达相关性;(2)比较采用不同的重复检测探针的方法得到的表达谱数据之间的相关性;(3)分析采用不同的重复检测探针的方法对差异基因和差异表达功能类筛选的影响;(4)采用基于BLAST局部序列比对方法分析对应同一个基因的一组检测探针,进行优化筛选,获取更能特异地反映基因表达的检测探针。