位置:成果数据库 > 期刊 > 期刊详情页
基于图聚类的脱机手写文档图像文本行分割
  • ISSN号:1671-4512
  • 期刊名称:华中科技大学学报(自然科学版)科技大学
  • 时间:2014
  • 页码:33-36
  • 分类:TP391.43[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]武汉大学电子信息学院,湖北武汉430072, [2]中国科学院自动化所模式识别国家重点实验室,北京100190
  • 相关基金:国家自然科学基金资助项目(61273269,61175021)
  • 相关项目:基于扰动的文字识别理论和关键技术研究
中文摘要:

提出了一种基于自适应游程平滑算法和基于改进的最小张树聚类的文本行分割算法,该算法基于图的集成聚类的框架用以进一步解决文本行分割的问题,该框架可以很容易地推广到对更多的单一算法进行融合.在该融合框架中,由对应于连通部件的顶点以及顶点对之间的边构成文档图,边上的权值由两个单一文本行分割算法的结果决定.于是,文本行分割的任务就转化为如何以最小代价对文档图进行划分的问题.该融合算法在哈尔滨工业大学多人手写数据库上取得了较好的效果,召回率为99.31%,错误率为0.94%.

英文摘要:

A graph-based clustering ensemble method combining the adaptive run-length smoothing technique with the algorithm was proposed based on minimum spanning tree clustering with distance metric learning.A weighted undirected graph was constructed with nodes corresponding to connected components and edge connecting pairs of connected components.Text line segmentation was then posed as the problems of minimum cost partitioning of the nodes in the graph such that each cluster corresponded to a unique line in the document image.Experimental results on Harbin Institute of Technology-Multiple Writers Database shows its efficiency and effectiveness with a correct detection rate of 99.31%,and an error rate of 0.94%.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《华中科技大学学报:自然科学版》
  • 中国科技核心期刊
  • 主管单位:中华人民共和国教育部
  • 主办单位:华中科技大学
  • 主编:丁烈云
  • 地址:武汉珞喻路1037号
  • 邮编:430074
  • 邮箱:hgxbs@mail.hust.edu.cn
  • 电话:027-87543916 87544294
  • 国际标准刊号:ISSN:1671-4512
  • 国内统一刊号:ISSN:42-1658/N
  • 邮发代号:38-9
  • 获奖情况:
  • 全国优秀科技期刊,首届国家期刊奖,第二届全国优秀科技期刊评比一等奖,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:21013