本项目面向多元数据,以多元数据多元图表示和图处理技术为手段,基于多元数据多元图图形特征降维和分类的学术思想,建立起一种基于多元图形特征的、可视化的模式识别新理论和方法。主要学术思想是针对具体的应用环境,将来自样本空间的多元数据矩阵增广为表示矩阵,基于表示矩阵多元图表达新思想,在特征空间形成鲜明的多元数据图形特征,再基于多元图形特征用模糊推理、平行筛方法和基于条形码和标度空间理论方法进行分类,在类型空间得到模式识别结果。初步研究结果表明本项目提出的模式识别方法具有模式可视化(使看不到的看得到)、复杂系统表示简单化(复杂系统信息图表示的特点)和复杂系统信息处理更容易(多元数据图处理技术具有简单、实用、有效)等鲜明特点。可望本项目原创性的学术思想在模式识别领域探索出一条崭新的道路,做出特色性成果,具有十分重要的学术和实际应用价值。
本项目提出了基于多元数据多元图表示,利用机器算法和人机交互协作,进行可视化模式识别的理论和方法。主要学术思想是首先将来自样本空间的多元数据矩阵映射为表示矩阵,构建多元图。然后基于多元图的表示矩阵模型,利用优化算法和人机交互协作进行优化处理,优化操作可以通过图形进行实时动态显示以提供优化效果的视觉反馈。在优化图上形成有利于分类的多元数据图形特征,最后利用分类算法进行分类,在分类图上得到模式识别结果。本项目深入研究了平行坐标图的表示特性,提出并证明了平行坐标的投影表示定理,指出平行坐标可以表示多个变量的非线性函数,从而奠定了基于平行坐标的可视化模式识别方法的理论基础。实现了两种基于优化平行坐标的可视化分类器平行筛分类器和可视化贝叶斯分类器。分类精度分别与线性判别算法和简单贝叶斯算法分类精度相当,但具有更好的可解释性,并有利于提高领域专家对分类结果的信任度。研究结果表明,本项目提出的模式识别方法具有模式可视化(使看不到的看得到)、复杂系统表示简单化和有利于专家知识的利用和生成等特点。有望进一步发展和完善该方法,并将其应用于疾病诊断等实际领域的模式识别问题。