基于扰动的文字识别方法有望克服传统的基于归一化和机器学习的文字识别方法的不足,有效提高识别精度,但是还有一些关键理论和技术问题有待解决。本项目基于贝叶斯分类原理和特征空间回归方法,系统地研究基于扰动的文字识别理论和关键技术,提出和实现有效的方法和算法,以达到提高识别性能、推动实际应用的目的。主要研究内容和创新点包含(1)基于扰动方法合成样本的选择和分类器训练的有效算法;(2)扰动分类结果的高效融合理论与方法研究;(3)利用风格一致约束的基于扰动的文字识别方法研究;(4)图像扰动和特征空间扰动的关系模型和特征空间扰动方法研究。我们将在已有的技术基础和数据基础上,在自由手写汉字识别问题中检验所提出方法的有效性,并发表一系列学术论文,产生较大的学术影响。本项目提出的理论和方法基于特征空间分析,因而可以推广到一般的模式识别框架,用来解决目标识别、人脸识别、语音识别等问题。
character recognition;perturbation;Style consistent;Discriminative feature learning;Dimensionality promotion
基于扰动的文字识别方法有望克服传统的基于归一化和机器学习的文字识别方法的不足,有效提高识别精度。本项目系统地研究基于扰动的文字识别理论和关键技术。通过系统深入的研究,本项目主要研究贡献在于1)搭建了一个基于GPU并行计算平台的文字训练和识别系统;2)采用扰动样本生成结合梯度方向特征的统计和空间相关性进行大规模特征升维的方法使文字识别性能得到了显著的提升,取得了与单个深度神经网络系统的相当的性能,而训练和识别的计算量要比深度神经网络低很多;3)建立了基于风格一致性扰动识别的系统框架;4)将扰动识别方法运用于手写数字串的识别,取得了业界最好的识别效果。