位置:成果数据库 > 期刊 > 期刊详情页
基于最大熵短语重排序模型的特征抽取算法改进
  • 期刊名称:中文信息学报
  • 时间:0
  • 页码:78-82
  • 语言:中文
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]中国科学院计算技术研究所智能信息处理重点实验室,北京100190, [2]苏州大学计算机科学与技术学院,江苏苏州215006
  • 相关基金:国家自然科学基金资助项目(60873167 60736014)
  • 相关项目:面向科技文献的机器翻译关键技术研究
中文摘要:

该文针对统计机器翻译中基于最大熵短语重排序模型特征抽取算法,提出一种改进算法。该算法能够抽取出更多准确的短语重排序信息,特别是逆序短语的特征信息,解决了原算法中最大熵训练时特征数据不平衡的问题,提高了翻译中短语重排序的准确率。以NIST MT 05作为汉语到英语翻译的测试集,实验结果表明改进后的系统BLEU值比原系统提高0.65%。

英文摘要:

This paper presents an improved feature extraction algorithm for maximum entropy based phrase reordering model.The algorithm can extract more accurate feature information of phrase reordering,particularly the feature of inverted phrases.It solves the problem of uneven distribution of feature information and increases the rate of correct translation.We use BLEU as a metric on Chinese-to-English translation,and the proposed algorithm obtains a relative improvement of 0.65% over baseline system.

同期刊论文项目
期刊论文 17 会议论文 23 专利 6
期刊论文 77 会议论文 94 专利 4 著作 2
同项目期刊论文