双语语料库建设及其自动对齐研究对计算语言学的发展具有重要的意义。目前国内外已建立了各类汉英双语语料库以及服务于汉英机器翻译的双语对齐语料库和短语库。为了少数民族语言的机器翻译的研究从一开始就从较高起点起步,本项目研究对限定领域的汉文-维吾尔文双语文本的篇章级、段落级、句子级自动对齐技术进行研究,为研制开发"面向政府文献和科技文献的汉维机器辅助翻译系统"奠定基础。项目研究专注于汉-维双语对齐翻译规则归纳以及双语语料库与短语库结构框架的构建,双语语料的收集、整理、存储以及检索等关键技术的技术。其成果是制定汉维双语语料文本收集整理规范和汉维双语语料文本收集加工规范,建立具有统一标准和规范的大规模汉文-维吾尔文双语篇章级、段落级句子级对齐的面向汉维机器翻译的双语对齐语料库和短语库。