本项目利用生物信息学的手段与工具,从典型模式生物出发,研究以蛋白质-蛋白质相互作用(PPI)网络为代表的生物学网络数据的模式解析算法,并在此基础上,建立大规模高通量的蛋白质相互作用网络分析及蛋白质功能预测平台,发展相关的并行模型与并行算法。本项目的主要研究内容及成果包括(1) 针对生物学网络的功能模块性的分析与判定进行研究,建立了生物学网络模块节点之间最短路径的快速计算方法,提出了PPI网络典型模式解析与挖掘的新方法。(2) 针对典型模式生物的PPI网络数据,提出了基于网络结构进行功能社团划分的新方法,并利用该技术发展了蛋白质功能预测与注释方法。(3) 针对大规模蛋白质序列数据的预处理问题,发展了蛋白质序列数据搜索的并行加速方法。(4) 针对大规模生物学网络数据,发展了一种PPI网络的二维布局与平面绘制方法并完成了并行实现。(5) 针对大规模代谢网络数据,提出一种基于KEGG数据库的代谢网络重构方法,建立了一种基于代谢网络的系统发育网络重构方法。本项目的研究有助于深入理解蛋白质相互作用的机理与规律,对探索病原体致病机理、识别发现药物靶标、有效开展高危疾病防治具有潜在的理论与现实意义。
英文主题词parallel computing; bioinformatics; protein-protein interaction; pattern discovery; function prediction