本项目拟通过分析不同种类组织样本的基因表达谱,研究确定有助于分类的功能基因组,并进一步研究利用功能基因组分类组织样本的方法。利用基因表达数据分类组织样本的方法同传统的基于组织表现形态的分类方法相比,能从分子级上区分不同样本类,进而能提供更可靠、更精确的分类结果。应用于临床,有助于早期肿瘤的诊断,并能为肿瘤致病基因的寻找提供线索。
项目围绕基于基因表达谱的组织分类问题,开展三个方面的研究开发,即建立本地基因数据库管理系统、基因选择和分类器设计。数据库管理系统以LINUX为开发平台,采用B/S的设计模式,用来收集、整理和存储相关数据资源。在基因选择问题中,提出了结合聚类分析的基因选择新模式,有效解决了基因的冗余问题;提出了自适应的聚类算法,同传统算法相比,该算法不受数据空间分布的限制,也不需要人工指定目标簇的数目,具有很强的自适应性;提出了基于演化算法的基因选择新方法,该方法将Wrapper和Filter模式有机结合,既提高效率,有能找到整体区分能力强的基因集。在分类器的设计上,采用分类器装配(集成)的模式,将目前应用广泛的分类算法有机集成,构成多分类器系统,该系统克服单一分类器的数据偏向性,具有很好的普适性和较高的分类精度。项目已资助发表论文22篇。其中SCI检索5篇,EI检索15篇,ISTP检索15篇。