蛋白质相互作用在生命活动中起着核心作用,然而由高通量实验方法产生的蛋白质相互作用数据存在严重的假阳性和假阴性"噪声",因而不利于蛋白质组学研究的进一步发展。本项目利用复杂网络理论和机器学习方法发展评估蛋白质相互作用可信度的新理论、新算法及在线评估分析平台。主要研究包括1)提出基于最小子集覆盖的快速流形学习算法来评估蛋白质相互作用可信度,有效解决了已有算法无法应用在稀疏网络上的缺陷;2)发展基于线图变换和加权网络拓扑信息的蛋白质相互作用可信度评估算法,使得复杂网络理论可被用来解决蛋白质相互作用可信度评估问题。3)提出整合局部和全局拓扑结构信息对蛋白质相互作用可信度进行评估的混合策略,以克服评估过程中存在的偏向性问题。通过本项目的研究,将为最终构建一个高可信度的蛋白质相互作用数据评估系统提供理论基础和技术支撑,从而为促进蛋白质组学和药物分子设计等的研究打下良好基础。
Protein-Protein Interactions;Reliability Assessing;Network Topology;Manifold Learning;Line Graph
蛋白质相互作用在生命活动中起着核心作用,然而由高通量实验方法产生的蛋白质相互作用数据存在严重的假阳性和假阴性“噪声”,因而不利于蛋白质组学研究的进一步发展。本项目利用我们在复杂网络、数学和机器学习等学科的优势,发展了新的评估蛋白质相互作用可信度的方法,同时建立了相关生物信息学研究平台。主要工作有(1)提出了基于最小子集覆盖的快速流形学习算法来评估蛋白质相互作用可信度,有效解决了已有算法无法应用在稀疏网络上的缺陷;(2)发展了基于线图变换和加权网络拓扑信息的蛋白质相互作用可信度评估算法,使得复杂网络理论可被用来解决蛋白质相互作用可信度评估问题。(3)提出了整合局部和全局拓扑结构信息对蛋白质相互作用可信度进行评估的混合策略,克服了评估过程中存在的偏向性问题。通过本项目的研究,为最终构建一个高可信度的蛋白质相互作用数据评估系统提供了理论基础和技术支撑,从而为促进蛋白质组学和药物分子设计等的研究打下了良好基础。