位置:成果数据库 > 期刊 > 期刊详情页
非均匀光照文档图像快速二值化方法
  • ISSN号:1000-386X
  • 期刊名称:《计算机应用与软件》
  • 时间:0
  • 分类:TP391.1[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]北方工业大学信息工程学院,北京100144
  • 相关基金:国家自然科学基金资助项目(61371142);十一五国家科技支撑平台重点基金项目(2009BAl71802);北京市自然科学基金资助项目(4132026);北京市属高等学校人才强教计划资助项目(PHR201007121).
中文摘要:

拍照方式获取的文档图像在OCR识别中,可能因光照不均而导致识别率低下。针对此问题,提出一种基于分块的自适应文档图像快速二值化方法。根据文档区域亮度特征划分光照均匀区域、阴影区域及亮光区域,对不同区域自适应地选取最有效的二值化算法。为解决传统White算法自适应能力的不足,对其进行改进,有效减少了伪影和断笔的产生。实验结果表明,该方法能明显提高光照不均文档图像的OCR识别率,且校正速度快、鲁棒性好。

英文摘要:

The OCR recognition rate of camera-based document images may be low due to uneven illumination. To solve this problem, the paper puts forward a blocking-based fast adaptive binarisation method for document image. The method distinguishes the uniform illumination area, shaded area and strong light area according to regional lightness feature of the document, and selects the most effective binarisation algo- rithm adaptively for different areas. Traditional White algorithm has been improved to solve its shortage in adaptive ability, which effectively reduces the ghost artifacts and the phenomenon of missing strokes. Experimental results show that the method can significantly improve the OCR recognition rate of uneven illumination document images with fast correction speed and good robustness.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机应用与软件》
  • 北大核心期刊(2011版)
  • 主管单位:上海科学院
  • 主办单位:上海市计算技术研究所 上海计算机软件技术开发中心
  • 主编:朱三元
  • 地址:上海市愚园路546号
  • 邮编:200040
  • 邮箱:cas@sict.stc.sh.cn
  • 电话:021-62254715 62520070-505
  • 国际标准刊号:ISSN:1000-386X
  • 国内统一刊号:ISSN:31-1260/TP
  • 邮发代号:4-379
  • 获奖情况:
  • 全国计算机类中文核心期刊
  • 国内外数据库收录:
  • 波兰哥白尼索引,美国剑桥科学文摘,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2011版),中国北大核心期刊(2000版)
  • 被引量:27463