计算机字符识别技术已在文档自动录入、海量表格处理、邮件自动分拣、交通和工业监控等得到了广泛应用,但是性能还远远不令人满意。计算机在非限制性手写体汉字识别和英文词句识别等方面的性能与人相比仍有较大差距。本研究的目的是在模式识别和字符识别最前沿方法的基础上,结合多种模式分类和学习方法提高手写汉字识别的精度,以推动汉字识别的进一步应用。具体方案是在采用最有效的整形变换归一化和特征提取方法的基础上,结合统
手写汉字识别是一个大类别集分类问题,目前还没有达到足够高的识别正确率。主要难点有三个由书写风格差异造成的字符变形大、相似字较多、类别数大。本项目主要从大类别集分类的角度设计有效的多分类器系统以提高手写汉字识别的精度,同时寻找新的图像预处理和特征提取方法。取得的成果主要有两方面(1)在特征提取方面,提出一种结合坐标变换的梯度方向特征提取方法,在伪二维非线性归一化的情况下能减小形变的影响,将识别错误率减少了10%以上。该方法发表在IEEE Trans. Pattern Analysis and Machine Intelligence.(2)在常用的修正二次鉴别函数(MQDF)分类器基础上,提出了一种基于线性鉴别分析(LDA)的复合距离方法,将MQDF的识别错误率减少了26%以上。该方法发表在国际文档分析与识别大会(ICDAR),扩展论文已投稿到Pattern Recognition. 另外,本项目负责人与国外学者合著了一本文字识别的专著,已由John Wiley出版社出版;代表中国学者成功将2001年ICDAR申请到北京主办。