位置:立项数据库 > 立项详情页
面向汉维机器翻译的双语对齐语料库和短语库构建技术的研究
  • 项目名称:面向汉维机器翻译的双语对齐语料库和短语库构建技术的研究
  • 项目类别:地区科学基金项目
  • 批准号:60663006
  • 申请代码:F020603
  • 项目来源:国家自然科学基金
  • 研究期限:2007-01-01-2009-12-31
  • 项目负责人:吐尔根.依布拉音
  • 负责人职称:教授
  • 依托单位:新疆大学
  • 批准年度:2006
中文摘要:

双语语料库建设及其自动对齐研究对计算语言学的发展具有重要的意义。目前国内外已建立了各类汉英双语语料库以及服务于汉英机器翻译的双语对齐语料库和短语库。为了少数民族语言的机器翻译的研究从一开始就从较高起点起步,本项目研究对限定领域的汉文-维吾尔文双语文本的篇章级、段落级、句子级自动对齐技术进行研究,为研制开发"面向政府文献和科技文献的汉维机器辅助翻译系统"奠定基础。项目研究专注于汉-维双语对齐翻译规则归纳以及双语语料库与短语库结构框架的构建,双语语料的收集、整理、存储以及检索等关键技术的技术。其成果是制定汉维双语语料文本收集整理规范和汉维双语语料文本收集加工规范,建立具有统一标准和规范的大规模汉文-维吾尔文双语篇章级、段落级句子级对齐的面向汉维机器翻译的双语对齐语料库和短语库。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 25
  • 0
  • 0
  • 0
  • 0
吐尔根.依布拉音的项目