本项目针对未知结构的小分子蛋白氨基酸序列,将基于知识的方法与计算化学、统计物理学方法以及优化计算相结合,采用简化的蛋白质晶格模型,并根据已知结构蛋白质导出的平均势场,在二级结构预测的基础上,从理论上进行小分子蛋白三级结构的从头预测。首先利用现有软件提取未知结构蛋白的二级结构;并用晶格模型格点搜索方法对Loop区建模;再基于智能信息处理技术,将Monte Carlo生长链与遗传算法相结合,通过对势能函数的优化进行Loop区预测结构的优化;继而,通过构建侧链初始构型,获得蛋白质三级结构的整体初始构型;最后综合蛋白质生物化学性质进行蛋白质三级结构的整体优化。Loop区的结构预测及优化计算是本项目研究的重点,其研究成果将填补目前国际上尚无Loop区精确建模的空白,从而加快蛋白质结构预测的研究进程,促使最终揭示蛋白质的结构与功能关系。
本项目以小分子蛋白为研究对象,将基于知识的方法与优化计算相结合,根据已知结构蛋白导出的平均势场,从理论上进行三级结构的从头预测。首先,利用现有二级结构预测软件提取蛋白的二级结构片段,再基于BLAST对提取的规则片段进行调整,并提取主链坐标,然后用SCWRL3构建相应的铡链;其次,采用Modeller程序构建Loop区的初始构型,并将遗传算法和局部搜索算法相结合,对Loop区初始构型进行优化,获取Loop区三维空间的优化结构;最后,将预测所得的二级结构片段通过连接点的坐标平移,对氨基酸全序列三级结构进行整合,再综合蛋白质生物化学性质,将遗传算法与粒子群算法相结合,对整合结构进行优化,获取全序列的三级结构。通过对小分子蛋白的测试与评估表明,对5-10个残基的二级结构规则片段预测误差在0.6?以内;对4-12个残基的Loop区三维空间结构的预测,90%以上预测误差在3?以内;而对20-70残基的小分子蛋白,全序列三级结构整合预测精度,80%以上预测误差在8?以内。研究成果表明了本项目的研究工作能有效应用于小分子神经毒素的三级结构预测,具有良好的应用前景和推广价值。