木刻印刷蒙古文古籍文献资料,内容涉及宗教、历史、文学、天文、医学等诸多方面,是人类的宝贵文化遗产。这些文献中以清代康熙年间(1720年)在北京木刻印刷的蒙古文《甘珠尔经》最具代表性,仅存世八套。本项目以蒙古文《甘珠尔经》为对象,从文字识别和信息检索的角度出发,系统的研究和解决了木刻印刷蒙古文古籍识别与检索中所涉及的蒙古文字元切分、字元集的确定、字元的特征分析与选择、分类器设计、识别后处理、错误校正、索引项选择等关键问题。在此基础上,开发出一套初步可用的木刻印刷蒙古文古籍识别与检索系统。这些工作对挖掘和利用蒙古文古籍文献资料、传承和发展少数民族文化、促进民族地区的社会发展和科技进步都具有重要意义。
英文主题词Woodblock printing; Mongolian Kanjur; Glyph segmentation; Multiple classifier combination; Document image retrieval