传统的蛋白质科学研究遵循"序列-结构-功能"的范式,而随着实验数据的积累,人们逐渐意识到柔性对蛋白质功能的至关重要性。要真正了解蛋白质的"序列-结构-柔性-功能"这种新范式,还有大量的工作需要开展。目前,柔性建模已是蛋白质结构学中的一个研究热点,除实验方法外,主要分成物理计算模型和智能计算两大部分,各类计算方法都存在一定的优缺点。其中,智能计算方法具有成本低、高效、数据处理规模大等特点,但应用于柔性预测研究才刚刚起步,还有待进一步的深入研究。本项目拟集中或结合智能计算与高斯网络模型各自的优点,设计新的特征向量,利用多种(混合的)智能计算方法,从氨基酸序列或蛋白质结构出发,建立起一系列各具特色的高精度柔性预测模型,并进一步系统性地对各类柔性数据进行预测和分析。蛋白质柔性的精确建模可以为药物设计、蛋白质结构预测、分子柔性对接等重大课题提供理论基础。
protein;flexibility modeling;intelligent computing;Gaussian network model;solvent accessibility
柔性建模已成为蛋白质结构生物信息学中的一个研究热点。项目总体围绕”序列-结构-柔性-功能”的新范式思路,计划拟从蛋白质的序列或结构出发,以 X 射线结晶学和 NMR 实验确定的柔性度量(如 B-因子、无序区域和 RMSD 等)为预测目标,设计新特征,利用智能计算方法,结合物理模型,构建起一系列各具特色的柔性预测模型。 原研究计划中的大部分内容得以顺利实施,研究成果及意义主要包括(1) 首次进行较大规模的RMSD柔性度量预测研究与比较分析,与B因子柔性度量相比,发现众多新的异同之处,在选取柔性度量上具有指导意义;(2) 提出了一种改进我们原先工作的B因子预测方法,主要是在简易的RSA线性回归模型中加入氨基酸对特异性信息,利用两阶段线性回归和粒子群算法估计相关待定参数,结果表明,提出方法即增进了B因子预测精度,同时也保持模型的简洁性;(3) 首次提出一种基于序列的高斯网络模型,在研究结构未知的蛋白质时,意义重大,因而有望在高通量的蛋白质序列功能和动力学分析中获得广泛应用;(4) 在经典的参数自由高斯网络模型中,加入残基对的RSA信息,构建出一种新的高斯网络模型RpfGNM,提升了B因子预测精度,该模型充分结合利用了GNM和RSA模型各自的优势。