项目基于蛋白质元胞自动机图和灰色理论,研究蛋白质序列离散灰色模型的构建及其在药物设计中的应用。蛋白质元胞自动机图(CAI)将蛋白质序列转换成二维图像,能将许多隐含在长而复杂的生物序列中的特征表现出来。从CAI中得出的参数作为蛋白质伪氨基酸成分能很好描述的蛋白质序列整体特征。在此基础上建立精确性分析框架下的蛋白质序列扰动"放大"平台,建立蛋白质序列离散灰色模型。本项目设计一种新的基于改进的灰关联度模式识别方法,研究蛋白质序列自动分类技术,挖掘蛋白质序列特征以及不同特征与蛋白质结构和功能之间的关系,提出多序列之间的灰色关联度检验准则,了解蛋白质特征序列的家族特性和进化特征。项目还将基于此模型研究与药物设计相关的蛋白质结构与功能预测模型,如GPCR结构类型预测、蛋白质-蛋白质结合位点预测、蛋白质四维结构预测等。这种概念模型对指导新药设计具有应用前景。
cellular automata image;protein sequence;grey dynamic model;predicting the function and st;
随着人类基因组计划的实施和推进,生物序列数据呈几何级数增长,迫切需要设计新的可视化模型和发展新的理论、方法、技术和工具。项目基于蛋白质元胞自动机图和灰色理论,研究蛋白质序列离散灰色模型的构建及其在药物设计中的应用。蛋白质元胞自动机图(CAI)将蛋白质序列转换成二维图像,能将许多隐含在长而复杂的生物序列中的特征表现出来。从CAI中得出的参数作为蛋白质伪氨基酸成分能很好描述蛋白质序列整体特征。灰色理论模型是一种研究少数据、贫信息不确定性问题的新方法,在蛋白质元胞自动机图和灰色理论基础上我们建立了精确性分析框架下的蛋白质序列扰动“放大”平台---蛋白质序列离散灰色模型。在描述氨基酸物理化学特性的氨基酸数字编码基础上,蛋白质序列转换成离散的数字序列,我们建立了常用的蛋白质离散灰色模型GM(1,1)和GM(2,1),提取了描述模型的参数作为蛋白质伪氨基酸成分。基于灰色理论提出了灰色PSSM(Position-Specific Scoring Matrix)参数,融合改进的GO和功能域伪氨基酸成分,构造了全面描述蛋白质序列特征的模型。本项目设计一种新的基于改进的灰关联度模式识别方法和多标签预测算法,研究了蛋白质序列自动分类技术,挖掘了蛋白质序列特征以及不同特征与蛋白质结构和功能之间的关系,了解了蛋白质特征序列的家族特性和进化特征。项目基于上述模型研究了与药物设计相关的蛋白质结构与功能预测模型,如GPCR结构类型预测、蛋白质-蛋白质结合位点预测、基于多标签算法的蛋白质亚细胞定位预测、蛋白质四级结构类型预测、蛋白质折叠率预测、抗菌肽及其功能类别预测、核受体及其类型预测、DNA绑定蛋白质预测等,建立了在线预测网站,提供了方便的在线预测功能,预测成功率比现有模型都有显著的提高,这种概念模型对指导新药设计具有应用前景。