模拟肽是能模拟蛋白质相互作用位点的多肽。处理与分析其中所含生物信息,可预测蛋白质相互作用位点与相互作用网络,已广泛用于疾病诊断、预防与治疗相关的基础与应用研究中。目前,通过多种表面展示实验已能高通量获得模拟肽序列;但相应专业数据库建设严重滞后,相关生物信息处理与分析方法存在严重噪声纳入与信息丢失,预测性能不尽人意。针对上述问题,本项目将在前期工作基础上,建设迄今最为完备的模拟肽数据库(MimoDB),挖掘、汇总噪声序列特征,建立基于模式识别与数据库搜索比对的噪声扫描过滤程序,开发基于氨基酸组成比对的模拟肽分析新算法并将其实现为网络程序。我们还将利用MimoDB数据并以上市药物美妥昔单抗为对象,对新方法的性能进行系统评估与实验验证。这些工作最终将形成一套以降噪保息为核心思想、性能优越可靠的模拟肽生物信息处理与分析新方法,成为相关科研工作的重要数据来源与新工具,具有重要的科学意义与应用价值。
mimotope;phage display;biopanning;target-unrelated peptide;protein-protein interaction
模拟肽是能模拟蛋白质相互作用位点的多肽,可通过噬菌体展示实验(生物淘选)较为方便地获得。处理与分析噬菌体展示实验中的模拟肽数据,可预测蛋白质相互作用位点与相互作用网络,已广泛用于疾病诊断、预防与治疗相关的基础与应用研究中。本项目的研究目标是建立从数据收集、噪声滤除到信号解析的噬菌体展示生物信息学平台并将其应用到生物医学研究中。 经过几年的努力,本项目取得的主要成果有(1)成功构建了迄今为止最为完备的噬菌体展示多肽数据库(MimoDB);(2)建立了一套基于模式识别与数据库搜索比对的噪声多肽预测、扫描、过滤程序(SAROTUP);(3)升级了模拟肽解析程序(MIMOX);(4)我们的数据资源及分析软件被我们自己及国内数十所大学与研究机构广泛运用,获得了较高的评价。 基于这些工作,我们在Nucleic Acid Research等国际期刊发表SCI 收录论文8 篇,单篇最高影响因子到达8.026,参加国际会议4 次(特邀报告及分组报告各2次)、国内会议2次(特邀报告及分组报告各1次),培养博士后1人、博士生1人、硕士研究生6人。无论是科学研究,还是人才培养,各项指标均超额完成。