蛋白质结构比较算法对于结构分类、结构模体识别、追踪分子演化及蛋白结构和功能预测至关重要,现有算法未能充分兼顾速度和可靠性。以C-alpha原子伪键表示蛋白质三维骨架,结构可由折角、扭角方便地描述。四肽段是坐标和角度彼此一一对应的最小基本单元。基于四肽段的三角度代表点在相空间的密度分布对构象态作聚类,可获得离散构象态码。构象态码将三维结构转化为一维字母序列。借助结构相似蛋白家族库FSSP,可收集构象态码的配对组合,通过计数计算构象态码配对概率与随机组合概率之比的对数,可构造构象态码的替代矩阵。于是,序列比较的所有成熟算法可略加修正后直接用于快速比较蛋白三维结构。本项目将着重发展基于最大星型树的算法实现多蛋白结构快速联配,将应用蛋白比较快速方法建立蛋白分类的权重矩阵,并发展结构模体识别方法。
英文主题词protein structure comparison, protein structure conformational codes, protein structure substitution matrix