蛋白质只有在折叠成特定的构形之后方能行使功能。结构测定是蛋白质组学的瓶颈,使用计算的方法根据蛋白质序列预测结构非常有意义。基于序列保守性的结构预测经典方法不适于远同源情形。基于局部序列-结构保守性的片段拼接法,受制于自由能经验统计势的有效性,通常不足以从众多的'最优'构形中挑选出唯一的天然构形,结果不很理想。规则二级结构片段通过基本物理相互作用如疏水相互作用形成保守的折叠内核,可望有最大的序列保守性。本项目考察来自不同螺旋或片层的小距离残基对,用残基对联线的长度、该联线与两个规则二级结构片段轴向之间形成的两个折角和一个扭角描述片段对的几何,在结构和序列的联合空间寻找保守模体作为蛋白质三维拼装基元,构建模体库。这样的基元直接刻画三维空间约束和拼装方式,是对传统统计势的重要补充,有助于加深对蛋白质折叠物理的认识,可用于蛋白质结构的分类、注释和预测,包括结构对接的预测。
protein structures;protein structure motifs;protein packing units;protein structure prediction;
蛋白质只有在折叠成特定的构形之后方能行使功能。蛋白质规则二级结构片段通过基本物理相互作用如疏水相互作用形成保守的折叠内核,可望有序列保守性。“蛋白质三维拼装基元”项目考察来自不同螺旋或片层的小距离残基对,用残基对联线的长度、该联线与两个规则二级结构片段轴向之间形成的两个折角和一个扭角描述片段对的几何,在结构和序列的联合空间寻找保守模体作为蛋白质三维拼装基元。然而,从一个结构数据库看,局部几何相似的邻近的二级结构片段对,可以找到很多,它们之间的两两序列相似性多数很低。从单个蛋白质结构看,邻近的二级结构片段对之中,既含有序列强保守的真正基元,又含有由前者连带而来的序列弱保守的近邻对。这也是通常的残基接触对分析中难见很强关联的重要原因之一。在执行项目的过程中,认识到需要对于拼装基元涉及的基础问题,有更深入的理解,因而,调整研究到如下两个方向单个二级结构片段的序列和结构间关联的特征,以及序列远程的氨基酸接触对的特征。已经得到的结论为蛋白质氨基酸序列在所有可能氨基酸序列中极为罕见,特异的序列顺序对实现其三维结构至关重要。总体而言,蛋白质序列与结构间的关联并不很强,但个别片段可有很强的局部结构信号。序列片段携带的结构信号有强有弱,强弱搭配。唯如此有利于局部调节最终至三维天然态。类似地,个别二级结构片段对,有强烈序列信号指示其间存在特异的相互作用并极易形成“结触点”,锁定局部“拓扑”。蛋白质折叠过程偏离各态历经。(见 CHIN. PHYS. B 上 2014 和 2015 年发表的两篇文章。) 对于蛋白质数据库详细分析的主要结果,小部分已正式发表,大部分正在总结整理或送审中。总之,本项目四年执行期里,始终坚持探讨蛋白质结构有关的较基础问题,得到了新认识蛋白质序列所含的结构信号在不同尺度上表现出有强有弱、强弱搭配的样式,以灵活实现功能。