位置:立项数据库 > 立项详情页
汉字字形形式化描述方法及自动比对工具研究
  • 项目名称:汉字字形形式化描述方法及自动比对工具研究
  • 项目类别:地区科学基金项目
  • 批准号:60863007
  • 申请代码:F020601
  • 项目来源:国家自然科学基金
  • 研究期限:2009-01-01-2011-12-31
  • 项目负责人:林民
  • 负责人职称:教授
  • 依托单位:内蒙古师范大学
  • 批准年度:2008
中文摘要:

由于目前汉字在计算机内缺乏统一有效的字形形式化描述方法和比对计算支持,无法通过字形描写方式输入所需的各种可能汉字,特别是错字、古籍异体字和民俗拼合字等特殊汉字,也无法利用计算机对汉字字形深入比对分析研究,这些问题严重影响了计算机在汉字研究、汉语教学、历史文化研究等领域的应用。本课题为解决这些汉字处理问题,对汉字字形形式化描述方法及字形比对计算方法展开研究,在继承和吸收已有各种字形描述方法优点基础上,建立了一种以笔段为基元特征的层次化汉字字形形式化描述体系- - 笔段网格字形描述方法和基于该体系的字形比对计算方法。该方法能描述一切可能的字形(包括正字、错字、古籍异体字以及拼合字等特殊汉字),能表示出各种字形骨架的异同,应用上也是一种汉字输入和显示的方法。字形比对计算方法能支持字形整体或局部的自动比对计算。在此基础上研制出汉字字形比对分析工具软件,并建立了实用规模的含有多层次特征描述信息的外国留学生错字字形语料库,为字形分析计算及应用建立了一种有效模型、方法和工具。从而满足语言文字研究、古籍整理研究、汉语教学和国际推广、数字化出版等领域对字形描述标准化方法、集外字输入与分析比对处理技术的需求。

结论摘要:

英文主题词Chinese characters glyph;Stroke-Segment-Mesh;Formal description;Glyph comparison;Wrongly written characters


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 7
  • 0
  • 0
  • 0
  • 0
相关项目
期刊论文 56 会议论文 1 著作 3
期刊论文 16 会议论文 2 专利 1 著作 1
期刊论文 14 会议论文 3 获奖 2 著作 1
期刊论文 19 会议论文 7 著作 1
林民的项目