B 细胞表位预测是计算机辅助疫苗设计的重要研究内容之一,本项目探讨如何使用机器学习方法建立高精度B 细胞表位预测模型。本项目针对线性表位预测和构象表位预测展开,主要包括三个方面的研究内容①在线性表位方面,研究机器学习框架下不等长线性表位的学习问题,克服现有模型的不足;②在基于结构的构象表位预测方面,分析影响现有方法精度的可能因素,研究包括表位与非表位不均衡问题、构象表位空间邻域表达问题、表位相关多特征融合问题,提出相应的解决方案,从而将预测精度提高到较为理想的水平;③尝试开展基于序列的构象表位预测的研究工作,挖掘序列上构象表位的分布规律,建立较为可靠的预测模型。本项目的最终目标是构建一个完整并且高精度的B 细胞表位预测系统。本项目的研究有望对疫苗和药物设计与开发,尤其是表位疫苗、治疗性疫苗和抗体药物的设计研制提供有效指导,从而节约大量的研究经费并加快疫苗的研制进程。
B-cell epitope;machine learning;ensemble learning;;
本项目探讨如何使用机器学习方法建立高精度B 细胞表位预测模型,针对线性表位预测和构象表位预测开展三个方面的研究工作①在线性表位方面,我们引入了若干能够将不等长序列转化为等长数值向量的编码方法,建立了高精度的预测模型,解决了不等长线性表位的学习问题;②在基于结构的构象表位预测方面,提出了表位与非表位不均衡的处理方案,设计了代表构象表位空间邻域的新特征,从而建立了高精度的机器学习模型;③尝试开展基于序列的构象表位预测的研究工作,挖掘序列上构象表位的分布规律,筛选了与表位最为相关的结构和序列特征,并使用集成学习方法融合多特征,建立较为可靠的预测模型。此外,我们对项目后续工作开展了研究,探讨了能够激活免疫的表位,即免疫表位,设计基于集成学习的模型从表位中识别免疫表位。