利用大规模相互作用数据构建蛋白质网络,从中挖掘功能模块对理解分子组成原理、揭示蛋白质功能及解释特定的生物进程具有十分重要的意义,是后基因组时代的研究热点。近年来对功能模块挖掘算法的研究大多是基于静态蛋白质网络展开的,无法体现真实世界中蛋白质相互作用的动态性和瞬时性。本项目主要研究面向动态蛋白质网络的功能模块挖掘算法及其应用。将结合时间序列的基因表达数据,研究动态蛋白质网络的构建及描述方法;采用图论和局部搜索技术对功能模块挖掘算法展开研究,以得到不同时间和空间通过相互作用绑定的动态功能模块;分析功能模块的保守性和进化速率,定义功能模块内蛋白质节点的拓扑参数,以预测生命活动所必须的关键蛋白质;研究功能模块动态变化在一些重大疾病预测方面的应用。本项目的研究不仅能突破原来静态蛋白质网络功能模块挖掘的局限性,还将为揭示功能模块动态变化引起人类病变的原因提供实验基础和理论依据。
Bioinformatics;Protein-Protein Interaction ne;Functional Module;Protein Complex;Essential Protein
在本基金的资助下,课题组在动态蛋白质网络的构建及描述方法、面向动态蛋白质网络的功能模块挖掘方法、基于功能模块的关键蛋白质识别方法及功能模块在疾病预测中的应用等方面进行了深入研究,并取得了较好的研究进展。提出了基于单一阈值的动态蛋白质网络构建方法和基于3-sigma法则的活性蛋白质网络构建方法,突破了传统静态蛋白质网络无法表达蛋白质相互作用动态特性的局限,有效提高了蛋白质网络聚类方法识别蛋白质复合物的准确性。提出了基于即时机制的蛋白质复合物的形成模型和基于核心-附件结构的动态蛋白质复合物识别方法。面向动态蛋白质网络,从拓扑分析的角度提出了可以区分识别蛋白质复合物和网络功能模块的新方法TSN-PCD和DFM-CIN。在关键蛋白质识别方面,结合蛋白质网络功能模块分析的成果,提出了新的网络中心性测度NC和集成复合物信息的HC中心性。为克服蛋白质网络的高噪声,进一步提出了集成基因表达数据和网络拓扑特征的关键蛋白质预测方法,进一步提高了关键蛋白质预测的准确度。通过同时考虑蛋白质网络中拓扑的相似性和疾病相似网络中表型的相似性,提出了一种新的致病基因预测方法,应用于前列腺癌和阿尔茨海默病等具有较好的预测效果。开发了集成于Cytoscape 的聚类分析和显示插件ClusterViz和CytoCluster,软件发布后引起国内外学者的广泛关注,根据Google Analytics 和Cytoscape app store的统计数据,累计已有来自近100个国家和地区的研究人员访问网站,软件使用手册已被下载5500 余次。许多学者采用我们开发的软件开展研究,取得重要研究成果。例如,宾夕法尼亚大学医学院的研究人员利用我们开发的ClusterViz软件对注意力缺陷多动障碍症展开研究,取得的重要研究成果发表在遗传学最好的期刊Nature Genetics(IF:35.209)上。项目的研究成果打破了原有静态蛋白质网络功能模块挖掘的局限性,不仅提高了蛋白质复合物和网络功能模块挖掘的准确性,也为揭示功能模块动态变化引起人类病变的机理研究提供一定的实验基础和理论依据,进一步推动我国生物信息学研究以及计算机基础理论研究的发展,对医药等行业的发展都将起到极大的促进作用。