位置:成果数据库 > 期刊 > 期刊详情页
对话行为信息在口语翻译中的应用
  • 期刊名称:中文信息学报
  • 时间:0
  • 页码:57-63
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]中国科学院自动化研究所模式识别国家重点实验室,北京100190
  • 相关基金:国家自然科学基金资助项目(60975053); 国家支撑计划资助项目(2006BAH03B02)
  • 相关项目:基于语言理解的机器翻译方法研究
中文摘要:

在口语翻译中,如何融入语义及语用信息一直是目前研究的难点之一。对话行为作为浅层话语结构描述的特征,近年来陆续应用于不同类型的翻译系统中。该文在介绍对话行为理论和口语标注语料的基础上,以基于短语的统计翻译系统为应用对象,提出了对话行为应用于翻译过程的三种方式。该方法通过对对话行为的自动分类,使训练语料—测试语料、开发集—测试集、源语言—目标语言的一致性得到提高,提高了翻译系统的性能,使最终的翻译结果可以更准确地反映源语言所要表达的对话意图。在汉英口语翻译评测数据上的实验证明,对话行为信息的加入使翻译系统的性能得到了有效的提高。

英文摘要:

How to apply semantic and pragmatics information is one of the difficulties in researches on spoken language translation.Dialog act,as a description of shallow discourse structure,has been utilized in several types of translation systems.In this paper,we first introduce dialog act theory and several famous dialog act annotated corpora.Based on annotated corpus and dialog act automatic recognition technology,we propose three kinds of applications of dialog act in phrase-based translation.By introducing the dialog act classification,our approach improves the consistencies between the training data and the test data,between the develop set and the test set,and between the source language and the target language.Further,the translation process is more effective and translation result is more accurate in reflecting the intention of source language.The experimental results on Chinese-to-English spoken language show that dialog act can make the spoken language translation system more accurate and effective.

同期刊论文项目
期刊论文 10 会议论文 26 专利 2
同项目期刊论文