位置:成果数据库 > 期刊 > 期刊详情页
基于索引的快速手写中文文档关键词检索
  • ISSN号:1003-6059
  • 期刊名称:模式识别与人工智能
  • 时间:2015.11
  • 页码:1033-1040
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]华中科技大学自动化学院,武汉430074, [2]中国科学院自动化研究所模式识别国家重点实验室,北京100190
  • 相关基金:国家自然科学基金项目(No.61305005,61273269,61175021)资助
  • 相关项目:基于扰动的文字识别理论和关键技术研究
中文摘要:

手写文档检索很难同时保证较高的检索精度和速度.基于上述原因,文中提出快速手写中文文档关键词检索方法,大幅提高检索速度并保持检索精度.该方法基于文本行识别的候选切分一识别网格预先生成压缩的索引文件,然后在索引上快速检索关键词.在手写中文文档数据库CASIA-HWDB上的实验证明文中方法的有效性,该方法不但压缩索引大小,而且缩短词检索的耗时.

英文摘要:

In document retrieval, high retrieval precision and speed can hardly be achieved simultaneously. A fast keyword spotting method for handwritten Chinese documents is proposed. By this method, keyword spotting is accelerated with accuracy preserved. Firstly, compressed index files are generated from the candidate segmentation recognition lattice of text lines recognition, then keywords are retrieved from the index files. Experimental results demonstrate the effectiveness of the retrieval time. on the handwritten Chinese proposed method. Moreover, documents database CASIA-HWDB it reduces the size of index and the retrieval time.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《模式识别与人工智能》
  • 中国科技核心期刊
  • 主管单位:中国科学技术协会 中国自动化学会
  • 主办单位:国家智能计算机研究开发中心 中国科学院合肥智能机械研究所
  • 主编:郑南宁
  • 地址:安徽省合肥市蜀山湖路350号中国科学院合肥智能机械研究所
  • 邮编:230031
  • 邮箱:bjb@iim.cas.cn
  • 电话:0551-5591176
  • 国际标准刊号:ISSN:1003-6059
  • 国内统一刊号:ISSN:34-1089/TP
  • 邮发代号:26-69
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:10169