基因组学、蛋白质组学和结构基因组学的研究积累了大量的蛋白质序列和结构信息,如何实现对这些蛋白的功能位点预测是当前生物信息学研究的一个重大课题。在过去三年里,本项目主要致力于开发基于酶分子序列和结构信息的酶功能预测的新算法。本项目的研究成果集中体现在以下三个方面。第一,我们已通过系统分析酶分子中活性位点氨基酸所处的序列和结构特征,提取可用于区分活性位点和非活性位点氨基酸的新参数,采用遗传神经网络方法,开发出预测酶分子结构中活性位点氨基酸的新算法。经严格测试,我们的新算法具有比一些已有方法更好的预测精度。第二,我们采用分子动力学模拟方法,验证了残基中心性是一个可用于区分催化和非催化氨基酸的稳健参数。第三,我们针对一个具有酶功多样性的蛋白折叠类型(即TIM-barrel蛋白),开发处可在蛋白质组学层次上应用的Tim-barrel蛋白识别方法(即TIM-Finder)。迄今为止,相关研究成果已发表三篇同行评议的SCI论文。我们希望本项目的实施不仅可增进我们对酶序列、结构和功能关系的理解,其研究结果还可直接用于加速目前功能基因组研究中对基因编码蛋白质的功能注释。
英文主题词Bioinformatics; Enzyme active site; 3D structure; Function; Prediction