本项目研究跨实验室、跨平台芯片数据预处理与整合问题。旨在发展一套基于芯片探针杂交物理模型的统计方法,考虑到芯片中探针强度对探针序列的相关性以及PCR 扩增所带来的系统偏差,利用单芯片样本估计靶序列拷贝数,实现跨实验室、跨平台芯片数据标准化与整合。作为应用,拟将算法应用于多种芯片数据分析之中,分析包括基因表达芯片、SNP 芯片、Tiling Array 芯片以及外显子芯片(Exon Array)等流行的生物芯片数据,开发多种芯片数据预处理开源软件,为生物学家提供分析工具。
英文主题词Gene Chip, PDNN model, probe set, Copy number of target sequence