模式识别研究的核心内容是如何提高分类器的性能,而多分类器的集成是实现这一目标的重要手段。理论和实践都已证实,通过对多分类器的有效集成,可以大大提高识别系统的性能。要实现一个高效的集成系统,就必须对参与集成的各个单分类器进行仔细地评估和选择。本项目以手写体字符识别为实验背景,研究分类器的评估与选择问题,进而得到了一种自动生成多分类器集成系统的方法。对于分类器的评估,我们从贝叶斯公式出发,经过推导,得到了一种新的可信度定义,该可信度能够适用于各种类型的分类器,而且具有后验概率意义。对于分类器的选择,可以采用最优化方法来解决,其中准则函数是关键。我们的研究表明,采用集成系统的识别率作为准则函数会影响系统的泛化能力,准则函数中应该包含互补性因子。我们给出了一种新的互补性度量,并据此设计了新的选择算法,将最优化搜索改进为启发式搜索,极大地提高了算法的效率。上述对单分类器的评估和选择方法,解决了多分类器集成的核心问题,我们据此实现了一个更高精度的手写体数字识别系统。分类器的评估是模式识别中的基本理论问题,分类器的选择是高性能集成型识别系统的关键,上述成果对模式识别理论及应用具有十分重要的意义。
英文主题词Multiple classifier combination; Classifier evaluation; Classifier selection; Confidence; Complementation