位置:成果数据库 > 期刊 > 期刊详情页
一种基于页眉线的扭曲文档图像快速校正方法
  • ISSN号:2095-302X
  • 期刊名称:《图学学报》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:北方工业大学计算机学院,北京100144
  • 相关基金:国家自然科学基金项目(61371142)
中文摘要:

在对文档图像进行光学字符识别时,由于书籍扭曲的存在,识别率会降低。对于含有页眉页脚线的扭曲文档图像,提出一种快速校正方法。首先分别检测并定位图像中的页眉线,保存页眉线的坐标信息。根据等比算法计算页眉线上各点在校正时所需向上或向下移动的距离,然后以此距离为参数扫描图像,计算页眉页脚线之间的各个目标像素校正所需移动的距离,同时进行像素点的移动重构图像,最终得到校正的图像。实验结果表明,该方法校正效果明显,对于包含页眉页脚线的扭曲文档图像有较好的校正效果,校正后OCR识别率大幅度提高。

英文摘要:

The recognition rate of OCR (optical character recognition) is low because of the warped document images. For those warped document images with header and footer lines, a fast method is proposed to increase the rate of OCR in this paper. Firstly, the location of the header line is detected and restored in the document image. Then the distance of the line moving upward or downward is calculated based on geometric algorithm. After that, the image is scanned using the distance as parameters and the distance that every target pixel needs to remove is calculated. At the same time, all pixel are removed in order to restructure the image and then a well corrected image is obtained. Experiments demonstrated that this correcting method was efficient. The OCR rate of warped document image with header line could be significantly improved.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《图学学报》
  • 中国科技核心期刊
  • 主管单位:中国科学技术协会
  • 主办单位:中国图学学会
  • 主编:李华
  • 地址:北京海淀区学院路37号
  • 邮编:100083
  • 邮箱:txxb_2011@163.com
  • 电话:010-82317091 82326420
  • 国际标准刊号:ISSN:2095-302X
  • 国内统一刊号:ISSN:10-1034/T
  • 邮发代号:
  • 获奖情况:
  • 全国中文核心期刊,全国科技论文统计用刊
  • 国内外数据库收录:
  • 中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:1124