由于目前汉字在计算机内缺乏统一有效的字形形式化描述方法和比对计算支持,无法通过字形描写方式输入所需的各种可能汉字,特别是错字、古籍异体字和民俗拼合字等特殊汉字,也无法利用计算机对汉字字形深入比对分析研究,这些问题严重影响了计算机在汉字研究、汉语教学、历史文化研究等领域的应用。本课题为解决这些汉字处理问题,对汉字字形形式化描述方法及字形比对计算方法展开研究,在继承和吸收已有各种字形描述方法优点基础上,建立了一种以笔段为基元特征的层次化汉字字形形式化描述体系- - 笔段网格字形描述方法和基于该体系的字形比对计算方法。该方法能描述一切可能的字形(包括正字、错字、古籍异体字以及拼合字等特殊汉字),能表示出各种字形骨架的异同,应用上也是一种汉字输入和显示的方法。字形比对计算方法能支持字形整体或局部的自动比对计算。在此基础上研制出汉字字形比对分析工具软件,并建立了实用规模的含有多层次特征描述信息的外国留学生错字字形语料库,为字形分析计算及应用建立了一种有效模型、方法和工具。从而满足语言文字研究、古籍整理研究、汉语教学和国际推广、数字化出版等领域对字形描述标准化方法、集外字输入与分析比对处理技术的需求。
英文主题词Chinese characters glyph;Stroke-Segment-Mesh;Formal description;Glyph comparison;Wrongly written characters