基因芯片技术是功能基因组研究的重要手段,基因表达数据分析是生物信息学的研究热点和难点之一。本项目提出融合基因组研究获得的众多基因功能相关信息对大规模基因表达数据进行综合分析与知识发现,提炼可有效用于基因表达分析研究的数据集,研究更有效且具有生物学意义的基因表达数据聚类、分类、以及用于类预测与类发现的特征基因子集提取的多信息融合算法,挖掘基因表达模式及其与基因结构功能属性之间的内在关系,探索基于特征基因子集与多信息融合的基因调控网络构建方法,研制基于多信息融合的基因表达数据分析软件系统,充分发挥基因芯片技术和相关基因组研究成果的作用。
微阵列(Microarray)技术是功能基因组研究的重要手段,基因表达数据分析是生物信息学的研究热点和难点之一。本项目提出了融合基因组研究获得的众多基因功能相关信息对大规模基因表达数据进行综合分析与知识发现,提炼出了可有效用于基因表达分析研究的数据集,挖掘了基因表达模式及其与基因结构功能属性之间的内在关系,设计了更有效的基因表达数据聚类、分类、以及特征基因提取的多信息融合算法,探索了基于多信息融合的基因调控网络构建方法,研制出了基于多信息融合的基因表达数据分析软件MageKey和基因调控网络构建工具。此外,还进一步开展了基因结构与功能预测的相关研究,研制出了基因功能预测软件、启动子与转录起始点识别软件、基因结构从头预测软件、表达序列标签(EST)数据分析软件、蛋白质结构预测软件、蛋白质相互作用预测与分析软件、疾病基因预测软件、人类G蛋白偶联受体(GPCR)预测与分类软件等,测试结果表明这些软件的预测精度均优于国际同类软件。上述软件均已提供Web服务(http://bioinfo.hust.edu.cn)。