位置:成果数据库 > 期刊 > 期刊详情页
基于连通域的扭曲中文文本图像快速校正方法
  • ISSN号:1000-7024
  • 期刊名称:《计算机工程与设计》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]北方工业大学信息工程学院,北京100144
  • 相关基金:国家自然科学基金项目(61371142);国家科技支撑计划基金项目(2012BAH04F03);北京市自然科学基金项目(4132026);北京市科技创新平台基金项目(PXM2013_014212_000011)
中文摘要:

针对扭曲中文文本图像文字识别率不理想这一问题,提出一种基于连通域的文本图像快速扭曲校正方法。根据汉字结构特征合并连通域,实现切分文字;利用就近聚合文字的方法定位文本行,按行垂直校正每个文字位置,获得被校正的图像。实验结果表明,该方法校正速度快,对严重扭曲的中文文本图像能取得较好的校正效果,校正后图像的OCR识别率明显提高。

英文摘要:

Character recognition rate of OCR (optical character recognition)processing is not satisfactory for warped Chinese document image.To resolve this problem,a fast distortion correcting method based on connected components was proposed. First,the connected components were combined together according to the Chinese character structure characteristics.Next,the Chinese characters were segmented one by one according to the combined connected components.After that,the text lines were identified based on the nearest aggregation method.Then,the vertical positions of the segmented characters were corrected ac-cording to every text line.As a result,a well corrected document image was obtained.Experimental results demonstrate that this correcting method is fast and can segment the Chinese character accurately.The OCR rate of the corrected images can be sig-nificantly improved.Even for the obviously distorted Chinese document images,this method can achieve better results.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机工程与设计》
  • 北大核心期刊(2011版)
  • 主管单位:中国航天科工集团
  • 主办单位:中国航天科工集团二院706所
  • 主编:汤铭瑞
  • 地址:北京142信箱37分箱
  • 邮编:100854
  • 邮箱:ced@china-ced.com
  • 电话:010-68389884
  • 国际标准刊号:ISSN:1000-7024
  • 国内统一刊号:ISSN:11-1775/TP
  • 邮发代号:82-425
  • 获奖情况:
  • 中国科学引文数据库来源期刊,中国学术期刊综合评价数据库来源期刊,中国科技论文统计与分析用期刊
  • 国内外数据库收录:
  • 波兰哥白尼索引,美国剑桥科学文摘,英国科学文摘数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:45616