利用生物质谱进行肽段和蛋白鉴定的一个重要且棘手的问题是鉴定结果的可靠性概率。由于数据的高度复杂性,国际上至今没有一种模型能对此进行准确地估算。反转数据库由于和正向数据库有一致的数据量和复杂度,代表了一种本底随机匹配,能较准确地估算正向数据库中随机匹配的数量,因此被相关研究者普遍接受。但至今,这种方法依然处于其发展的初级阶段。本项目在反转数据库的基础上,对经典的反转数据库进行了改进,使得能同时评估和整合串联和PMF数据。并在蛋白质组质控和处理方面进行了深入的研究,主要包括几个方面在肽段概率水平上,建立了反转错位数据库用以评估串联质谱和PMF的方法;在蛋白水平上,建立了一种模拟方法,并对蛋白概率的计算和蛋白推导方面进行了探索,评估了已有的方法和影响因素,并在此基础上建立了自己的新方法;综合上述的方法,建立了蛋白质组的数据处理流程,应用到了肝脏蛋白质组研究中,并根据此理念设计了蛋白质组表达谱数据库。
英文主题词Biological mass spectrum; Peptide and protein identification; Reversed database; Evaluation