本课题的研究目标是应用网格计算技术构建生物计算流程系统,使科学家能够从事定制式、综合性、合作性的生物信息学研究。本课题通过制定用以描述生物计算任务的xml标准来实现对异构数据来源和输出的计算程序的整合;通过建立具有可扩展性的底层任务管理数据库来实现可适用于各种用户请求的,具有多级联步骤和多并行任务的分布式生物计算的解析、分配、调度以及整合。本课题将结合药物筛选和人类基因组计划等生物、医药领域的应用
我们首先建立了一个基于网格的生物信息学流程计算框架系统Bioinformatics On-Demand (BOD)。BOD是基于网格而构建,可以动态按比例分配计算任务到网格各节点上,并自动处理流程计算。BOD能够支持具有多步骤多并行任务的复杂计算流程。用户可以提交一个或多个输入文件,定制并干预计算的具体流程,并以指定方式同时查看多个输出结果。BOD系统扩展了当前生物信息学软件的计算能力。 在BOD的基础上,我们重点开发了几个生物信息学的应用项目。这些体系包括CpG岛的预测与分析,转录因子结合位点(TFBS)预测分析,高度异质性肿瘤相关数据的整合分析,通用的生物信息学流程计算的集群解决方案(EasyCluster),及建立在该集群系统上的SNP运算分析等。