本项目面向表面加强激光解析电离飞行时间质谱(SELDI-TOF MS)数据,以多维数据多元图表示和图处理技术为手段,基于蛋白质质谱非等宽切分、局部数据归一化、局部信息最大化利用、局部信息对应比较和全局信息融合的学术思想,提出一种原创性、可视化的、基于多元图图形特征模式识别的癌症诊断新方法。提出以多元图图形特征来表达癌症诊断生物标记物(不同类别数据对应着不同的多元图形特征,也就是不同的病症模式)的
表面加强激光解析电离飞行时间质谱(SELDI-TOF MS)是基于蛋白质组质谱指纹检测复合生物标记物用于癌症早期诊断的重要技术,是当今国际研究的前沿问题,也是蛋白质组学在癌症诊断实验室研究和临床应用研究最急迫需要研究的热门问题。本项目针对蛋白质组质谱数据的高维小样本特性,提出了局部信息最大化保持的断层二值成像技术,建立了以多元图图形特征处理和表达癌症诊断生物标记物模式的可视化模型。断层二值成像技术可以观察到不同阈值下关于癌症和非癌症丰富的信息,得出的断层能量曲线能够揭示在不同质核比条件下的能量分布关系。基于多元图形特征的癌症诊断模型的实现过程为根据局部区域信息指标对质谱指纹做非等间距切分并对每一区间用多元图形表示,基于局部信息最大提取思想选取各区间的图形特征最终融合成多元图模板。设计了模糊推理分类器、相似度分类器和图形特征分类器等对可视化模型精度做出评价。对卵巢癌、前列腺癌的实验结果表明,所提出的方法能够得到较高的灵敏度和特异度,并在可视化方面具有独特优势,有利于更好的融入专家知识。本项目提出的癌症诊断新方法对于推动蛋白质质谱癌症诊断技术进步和掌握原创性核心技术都具有重要的应用价值。