位置:成果数据库 > 期刊 > 期刊详情页
基于文本行重构的扭曲文档快速校正方法
  • ISSN号:1000-7024
  • 期刊名称:《计算机工程与设计》
  • 时间:0
  • 分类:TP301[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]北方工业大学信息工程学院,北京100144
  • 相关基金:北京市自然科学基金项目(4132026);十一五国家科技支撑平台重点基金项目(2009BAl71802);北京市属高等学校人才强教计划基金项目.(PHR201007121)
中文摘要:

OCR在识别数码相机获取的文档图像时,常常会因为图像的扭曲而导致识别率低。为解决这一问题,提出了一种按文本行重构图像的方法来校正自然扭曲图像。应用形态学膨胀和游程平滑的方法对图像初始化,利用可变长模板搜索样本点,拟合出各文本行中心线,根据中心线估计每行文字的上下位置,利用提出的模型和重构算法进行文本行重构。实验结果表明,校正后图像的OCR识别率能得到显著提高,而且校正速度快,对于1000*1667像素的图像,校正时间能保证在500毫秒以内。

英文摘要:

When using OCR to recognize document images gotten by the digital camera, the recognition rate is always very low because of the warped content. To solve this problem, a new correction method based on text row reeonfiguration is used to reconfigure each text line. Every middle line of each text row is extracted with morphological expansion and RLSA methods at the beginning. Then using the length alterable model to search text line samples and using these to compute the actual text line equation. At last, each text row's top and bottom edges are estimated and the given model is used to reconstruct each text row. The experiment results show that the corrected images' OCR rate is significantly improved and correction speed is very fast. For document images of 1000 *1667 pixel, the correction time is no longer than 500ms.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机工程与设计》
  • 北大核心期刊(2011版)
  • 主管单位:中国航天科工集团
  • 主办单位:中国航天科工集团二院706所
  • 主编:汤铭瑞
  • 地址:北京142信箱37分箱
  • 邮编:100854
  • 邮箱:ced@china-ced.com
  • 电话:010-68389884
  • 国际标准刊号:ISSN:1000-7024
  • 国内统一刊号:ISSN:11-1775/TP
  • 邮发代号:82-425
  • 获奖情况:
  • 中国科学引文数据库来源期刊,中国学术期刊综合评价数据库来源期刊,中国科技论文统计与分析用期刊
  • 国内外数据库收录:
  • 波兰哥白尼索引,美国剑桥科学文摘,英国科学文摘数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:45616