位置:立项数据库 > 立项详情页
蒙古文自动校对研究
  • 项目名称:蒙古文自动校对研究
  • 项目类别:青年科学基金项目
  • 批准号:60603091
  • 申请代码:F020603
  • 项目来源:国家自然科学基金
  • 研究期限:2007-01-01-2007-12-31
  • 项目负责人:白双成
  • 负责人职称:研究员
  • 依托单位:内蒙古自治区社会科学院
  • 批准年度:2006
中文摘要:

本项目以纠正蒙古文音素(读音)输入法或各种构字元素混合编码输入法无法避免出现文字黏着组合及读音错误为研究目的,并解决回收利用已有蒙古文电子文档资源的应用基础研究项目。我中心有多年的蒙古文信息处理研究开发基础,并在近几年进行了大量的针对性研究,已具备项目研究基础。通过综合利用蒙古文字形比较算法、形音推导算法、未登录词回收分类与知识表示算法、复杂特征知识框架模糊匹配算法、多词典匹配机制、搭配统计匹配和多变体附加成分智能化判断等技术,研究跨编码体系的蒙古文拼写错误自动校对算法。项目重点解决蒙古文非词错误和局部搭配错误,并在此基础上为全局错误修正作铺垫。此项研究在教育、办公、出版、OCR后期处理、语音合成以及语料库建设等应用领域和科研领域都有着迫切的应用需求,也有着很好的市场开发前景。

结论摘要:

本项目以纠正蒙古文音素(读音)输入法或各种构字元素混合编码输入法无法避免出现文字黏着组合及读音错误为研究目的,并解决回收利用已有蒙古文电子文档资源的应用基础研究项目。我中心有多年的蒙古文信息处理研究开发基础,并在近几年进行了大量的针对性研究,已具备项目研究基础。通过综合利用蒙古文字形比较算法、形音推导算法、未登录词回收分类与知识表示算法、复杂特征知识框架模糊匹配算法、多词典匹配机制、搭配统计匹配和多变体附加成分智能化判断等技术,研究跨编码体系的蒙古文拼写错误自动校对算法。项目重点解决蒙古文非词错误和局部搭配错误,并在此基础上为全局错误修正作铺垫。此项研究在教育、办公、出版、OCR 后期处理、语音合成以及语料库建设等应用领域和科研领域都有着迫切的应用需求,也有着很好的市场开发前景。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 1
  • 3
  • 0
  • 0
  • 0
相关项目
期刊论文 27 会议论文 9
期刊论文 19 会议论文 5 获奖 2
期刊论文 7 会议论文 1
期刊论文 17 会议论文 2
期刊论文 4 会议论文 1 获奖 1 著作 2
白双成的项目
期刊论文 4 会议论文 1 获奖 1 著作 2