位置:成果数据库 > 期刊 > 期刊详情页
面向形态丰富语言的多粒度翻译融合
  • 期刊名称:中文信息学报
  • 时间:0
  • 页码:75-81
  • 语言:中文
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]中国科学院计算技术研究所,中国科学院智能信息处理重点实验室,北京100190, [2]中国科学院研究生院,北京100049
  • 相关基金:国家自然科学基金重点资助项目(60736014) 国家自然科学基金资助项目(60873167),致谢 感谢内蒙古大学和新疆大学提供的语料,感谢新疆大学的麦热哈巴·艾力老师在维吾尔语知识层面的帮助.
  • 相关项目:融合语言知识与统计模型的机器翻译方法研究
中文摘要:

形态丰富语言由于其复杂的形态变化,会导致大词汇量和数据稀疏问题,这给统计机器翻译带来了巨大挑战。该文通过将这类语言表示为不同的粒度,然后分别进行翻译;由于不同的粒度能表征语言不同层面的特点,通过对不同粒度的翻译结果进行词级系统融合,便可生成更好的译文。维吾尔语、蒙古语到汉语的两组翻译实验表明,这种多粒度系统融合方法改善了翻译效果,BLEU值比最好的单系统分别提高了+1.41%和+2.03%。

英文摘要:

Morphologically rich language,characterized by complex morphological changes,has huge vocabulary and serious data sparseness issue,which has brought a great challenge to machine translation.In this paper,we first analyze such language and use different granularities to represent and then translate them respectively.As different granularities can catch features of such language in different levels,we integrate the translation hypotheses from different granularities by the system combination approach to generate better results.Experimental results on Uyghur-Chinese and Mongolian-Chinese translation tasks show that system combination with multiple granularities improved the performance of translation,and gained +1.41% and +2.03% compared to the best single system measured by BLEU.

同期刊论文项目
期刊论文 77 会议论文 94 专利 4 著作 2
期刊论文 17 会议论文 23 专利 6
同项目期刊论文