位置:成果数据库 > 期刊 > 期刊详情页
基于底层图像特征组合的文本图像分类研究
  • ISSN号:1671-4598
  • 期刊名称:《计算机测量与控制》
  • 时间:0
  • 分类:TP301.6[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]江西理工大学电气工程与自动化学院,江西赣州341000, [2]江西理工大学信息工程学院,江西赣州341000
  • 相关基金:基金项目:国家自然科学基金资助项目(70971043);江西省自然科学基金项目(2008GZS0028)
中文摘要:

针对文本图像特有的图像特征.提出了一种基于底层图像特征组合的文本图像分类方法,该方法使用了两层C4.5决策树分类器,能将文本图像有效地分为标题文本图像、文档图像和场景文本图像.首先将样本图像转换为灰度图像,提取灰度直方图的特征,根据灰度直方图特征的不同。可以先区分文档图像:然后把余下的图像转换为二值图像,提取图像的GLCM纹理特征,根据GLCM特征区分场景文本I和标题文本图像.在开源的WEKA数据挖掘软件环境下进行仿真实验,结果表明该方法是可行的。并能够得到较高的查全率和查准率.

英文摘要:

A text image classification method based on the combination of underlying image feature was proposed in this paper. With two layers of C4.5 decision tree classifier, the method can divide the text image into caption text image, document image and scene text image. The text image classification is a two-step process. In the first place, the sample image is converted into gray image for histogram feature extraction. Document images could then be well distinguished according to the variable characteristics of the gray histogram. In the second place, the rest of the images are converted intb binary images to extract their GLCM features, according to which the scene text and caption text images are distinguished. Simulation experiments were carried out in the open source WEKA data mining software, the results showed that the method is feasible, and is able to get favorable recall and good precision ratio.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机测量与控制》
  • 北大核心期刊(2011版)
  • 主管单位:中国航天科工集团公司
  • 主办单位:中国计算机自动测量与控制技术协会
  • 主编:苟永明
  • 地址:北京海淀区阜成路甲8号中国航天大厦405
  • 邮编:100048
  • 邮箱:ly@chinamca.com
  • 电话:010-68371578 68371556
  • 国际标准刊号:ISSN:1671-4598
  • 国内统一刊号:ISSN:11-4762/TP
  • 邮发代号:82-16
  • 获奖情况:
  • 中国学术期刊综合评价数据库来源期刊,中国科技论文统计源期刊,“国家期刊奖百种重点期刊”
  • 国内外数据库收录:
  • 美国剑桥科学文摘,英国科学文摘数据库,中国中国科技核心期刊,中国北大核心期刊(2008版),中国北大核心期刊(2011版)
  • 被引量:27924