随着自然语言信息处理要求的不断提高和自然语言信息处理系统的不断升级,对各种语言语法信息词典(或语法知识库)的需求也不断增加。目前急切需要一部面向各种应用系统的、通用的"蒙古语语法信息词典",因为蒙古文扫描输入及文字识别、语音输入、蒙古文自动校对、不同蒙古文文本的自动转写、机器翻译等都需要蒙古语复杂特征集,在进行合一运算时提供知识支撑。目前蒙古语语法信息词典有了一个较为合理的框架结构,但信息词典的诸
随着自然语言信息处理要求的不断提高和自然语言信息处理系统的不断升级,对各种语言语法信息词典(或语法知识库)的需求也不断增加。蒙古文信息处理同样也急切地需要一部面向各种应用系统的、通用的"语法信息词典",因为蒙古文扫描输入及文字识别、语音输入、自动校对、不同蒙古文文本的自动转写、机器翻译等都需要蒙古语复杂特征集,在进行合一运算时提供知识支撑。目前蒙古语语法信息词典有了一个较为合理的框架结构,但信息词典属性字段的确定还需要进行大量的语料分析,所确定的字段是否能够满足不同应用系统的要求,还需要进行测试和论证。其主要内容为扩充总库记录和属性字段,增设分库,通过调试,使各种字段更趋合理。该项目在已有的自然科学基金课题基础上开发,属原有成果的继承和延伸,它集语法信息与语义信息于一身,具有理论上的创新性和技术上的开拓性。作为项目的阶段性成果,可以从词典中抽出一些字段,做成三种在线词典,供用户使用。