本项目以纠正蒙古文音素(读音)输入法或各种构字元素混合编码输入法无法避免出现文字黏着组合及读音错误为研究目的,并解决回收利用已有蒙古文电子文档资源的应用基础研究项目。我中心有多年的蒙古文信息处理研究开发基础,并在近几年进行了大量的针对性研究,已具备项目研究基础。通过综合利用蒙古文字形比较算法、形音推导算法、未登录词回收分类与知识表示算法、复杂特征知识框架模糊匹配算法、多词典匹配机制、搭配统计匹配和多变体附加成分智能化判断等技术,研究跨编码体系的蒙古文拼写错误自动校对算法。项目重点解决蒙古文非词错误和局部搭配错误,并在此基础上为全局错误修正作铺垫。此项研究在教育、办公、出版、OCR后期处理、语音合成以及语料库建设等应用领域和科研领域都有着迫切的应用需求,也有着很好的市场开发前景。
本项目以纠正蒙古文音素(读音)输入法或各种构字元素混合编码输入法无法避免出现文字黏着组合及读音错误为研究目的,并解决回收利用已有蒙古文电子文档资源的应用基础研究项目。我中心有多年的蒙古文信息处理研究开发基础,并在近几年进行了大量的针对性研究,已具备项目研究基础。通过综合利用蒙古文字形比较算法、形音推导算法、未登录词回收分类与知识表示算法、复杂特征知识框架模糊匹配算法、多词典匹配机制、搭配统计匹配和多变体附加成分智能化判断等技术,研究跨编码体系的蒙古文拼写错误自动校对算法。项目重点解决蒙古文非词错误和局部搭配错误,并在此基础上为全局错误修正作铺垫。此项研究在教育、办公、出版、OCR 后期处理、语音合成以及语料库建设等应用领域和科研领域都有着迫切的应用需求,也有着很好的市场开发前景。