位置:成果数据库 > 期刊 > 期刊详情页
一种考虑对齐不一致的短语翻译概率估计方法
  • 期刊名称:中文信息学报
  • 时间:0
  • 页码:118-122
  • 语言:中文
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]中国科学院计算技术研究所智能信息处理重点实验室,北京100190, [2]中国科学院研究生院,北京100190
  • 相关基金:国家自然科学基金重点资助项目(60736014, 60873167)
  • 相关项目:面向科技文献的机器翻译关键技术研究
中文摘要:

在统计机器翻译中,短语翻译概率特征对最终的翻译结果有着重大的影响。传统的估计方法只考虑了双语短语同时出现,满足对齐一致性的情况,而没有对其他情况进行统计,因而短语翻译概率的估计不够准确。该文中,我们修改了传统的短语概率计算公式,在估计概率的过程中充分地考虑短语的各种出现情况。多个测试集上的实验结果证明了我们方法的有效性。

英文摘要:

The phrase translation probability features have great effect on the statistical machine translation.The traditional method has a deficiency in the estimation of phrase translation probability by just dealing with the phrases with consistent word alignments.In this paper,we modify the traditional formula to consider all occurrences of phrases in the corpus.The experimental results on the various test sets demonstrate the effectiveness of our method.

同期刊论文项目
期刊论文 17 会议论文 23 专利 6
期刊论文 77 会议论文 94 专利 4 著作 2
同项目期刊论文