(限400字)单核苷酸多态性与致病性的关系以及所引起的致病机理的研究一直都是生物信息学研究中的一个热点和难点问题。本项目拟应用多种化学和生物信息学手段,结合多种蛋白质描述方法以及多重序列比对、同源模建和分子动力学模拟等方法,并通过引入新的有效的机器学习算法如基因表达式编程、最小二乘支持向量机、粒子群优化、决策森林等以及一致性模型思想, 探讨单核苷酸多态性与老年痴呆症、帕金森病、糖尿病、肥胖症等多种典型的孟德尔遗传及复杂性疾病之间的关系,建立合理、有效的预测模型,从中确定与致病性相关的蛋白质的主要单点突变,深入探索其致病机理,为推测孟德尔遗传及复杂疾病的致病机理提供有利依据,实现对未确定致病性的蛋白质单点突变的快速、高可信度的致病性预测。这一项目从分子水平和系统观念上研究孟德尔及复杂性疾病,对阐明孟德尔及其复杂性疾病的致病机理,寻找各种治疗和预防措施都有着非常重要的意义。
SAP;Machine learning;Molecular modeling;Mendelian disease;Complex disease
单核苷酸多态性与致病性的关系以及致病机理的探索是目前生物信息学研究中的热点和难点问题。本项目中,我们综合应用基于蛋白质序列信息计算出来的氨基端残基物化性质以及氨基酸的疏水性、溶剂可及表面积、摩尔体积、极化度等性质计算的蛋白质序列的Moreau-Broto自相关、Moran自相关、Geary自相关等多种自相关系数等多种蛋白质描述方法、结合最小二乘支持向量机、决策森林等多种机器学习算法和分子动力学模拟等方法,探讨了单核苷酸多态性与典型的孟德尔遗传及复杂性疾病之间的关系,建立了具有很好预测能力的预测模型,确定了与致病性相关的蛋白质主要单点突变及其存在的规律,并应用分子动力学模拟和结合自由能计算等分子模拟方法对朊病毒蛋白、流感病毒神经氨酸酶、HCV病毒NS3/4A蛋白酶、HIV病毒整合酶等蛋白的突变对其结构功能的影响进行了探讨和分析。我们还研究了B-RAF激酶V600E突变体与其抑制剂的相互作用模式。我们的研究结果可以实现对未确定致病性的蛋白质单点突变的快速、高可信度的致病性预测,也可以为从分子水平上研究孟德尔及复杂性疾病,对阐明孟德尔及其复杂性疾病的致病机理,寻找各种治疗和预防措施都有着非常重要的意义。本项目通过3年的研究工作,已顺利完成项目的计划内容。我们建立了基于序列信息序列的单氨基酸多态性与疾病相关性的预测模型,开发了基于WEB的序列-致病性关系预测系统及软件。同时,结合该项目也我们发展了新的一致性建模方法和策略,发展了基于序列的膜蛋白氨基酸残基性质的预测模型,并应用分子动力学模拟对主要突变引起的孟德尔遗传性疾病与复杂性疾病的致病机理进行了有效的探索。项目共发表SCI论文18篇,分别发表在国际化学信息学领域的知名刊物Biochimica et Biophysica Acta-General Subjects, Journal of Chemical Information and Modeling, Journal of Computational Chemistry,Molecular Biosystems, Antiviral Research等上。 本项目通过3年的研究工作,已顺利完成项目的计划内容。我们建立了基于序列信息序列的单氨基酸多态性与疾病相关性的预测模型,开发了基于WEB的序列-致病性关系预测系统及软件。同时,结合该项目