基因芯片技术是随着"人类基因组计划"(HGP)的进展而发展起来的分子生物学领域里具有里程碑式意义的一项重大技术革新,它为困扰人类多年的许多疑难病症的治疗带来了曙光。同时基因芯片数据含有较强的噪声也是研究者公认的问题。本项目拟对癌症诊断领域基因芯片噪声数据处理技术进行系统深入的研究。针对基因芯片数据维数高、样本少,噪声强的特点,利用传统数学统计和机器学习相结合的方法,从噪声消融角度研究自前期基因芯片图像量化到后期数值样本分析、知识挖掘等过程中低表达水平基因检测、误标记样本检测与修正、特异基因检测、数据降维以及实验方法指导等相关的理论与技术,形成一套适用于癌症诊断领域基因芯片噪声数据处理的算法与软件。本项目的研究成果将对基因芯片技术领域数据维数高、样本少,噪声强的问题提供有效的解决方案,将对基因芯片技术在癌症诊断领域的应用起到极大的促进作用。