位置:成果数据库 > 期刊 > 期刊详情页
人机互助的交互式口语翻译方法
  • 期刊名称:中文信息学报
  • 时间:0
  • 页码:58-64
  • 语言:中文
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]中国科学院自动化研究所模式识别国家重点实验室,北京100190
  • 相关基金:国家自然科学基金资助项目(60575043,60736014);支撑计划资助项目(2006BAH03802);国家863计划资助项目(2006AA01Z194)
  • 相关项目:融合语言知识与统计模型的机器翻译方法研究
作者: 宗成庆|刘鹏|
中文摘要:

基于短语的统计翻译模型是目前机器翻译领域广泛使用的模型之一。但是,由于在解码时采用短语精确匹配的策略,造成了严重的数据稀疏问题,短语表中的大量短语无法得到充分利用。为此,该文提出了人机互助的交互式翻译方法。对于翻译短语表中找不到的短语,首先通过模糊匹配的方法,在短语表中寻找与其相似的短语。然后利用组合分类器,判断哪些相似短语可能提高句子的翻译质量。最后,通过人机交互的方法,选择可能提高翻译质量且保持原句语义的短语。在口语语料上的实验结果证明,这种方法可以有效地提高翻译系统的译文质量。

英文摘要:

The phrase-based statistical machine translation model is widely studied and applied in the circle of machine translation research. However, the model uses the strategy of precise matching in decoding, which suffers severely from the data sparseness problem, leaving most phrases in phrase table under-exploited in translation process. Therefore we propose a novel interactive approach to translation based on human-machine cooperation. For an unknown phrase, the system finds its similar phrases in the phrase table through fuzzy matching. Then a classifier is combined to judge phrases capable of improving the translation quality. At last, the phrase which has the same meaning with the unknown phrase is decoded through human-machine interaction. The experimental results on spoken language corpus show that this approach significantly improves the translation quality.

同期刊论文项目
期刊论文 77 会议论文 94 专利 4 著作 2
期刊论文 6 会议论文 15 获奖 1 专利 3 著作 1
同项目期刊论文