本项目以解决口语翻译中的部分关键技术、改进口语翻译质量、提高口语翻译系统的鲁棒性为目标,对双语词汇自动对齐、调序模型、命名实体翻译、对话行为预测、人机交互模型和多引擎系统集成方法等关键问题进行了深入研究和探索,提出了基于多粒度划分的词语自动对齐方法、面向基于短语的统计翻译引擎泛化的调序模型、基于结构的命名实体翻译方法、基于有限状态机的人机交互翻译方法和利用马尔可夫决策过程及支持向量机的对话行为预测模型等一系列新的方法和模型,建立了大规模汉语口语对话语料库,实现的汉英机器翻译系统在国际口语翻译评测中取得了优异成绩。该研究属于语音、语言技术领域的多学科交叉国际前沿课题,开展这项研究不仅具有重要的科学意义和理论意义,而且具有极大的实用价值和广阔的应用前景。
英文主题词Spoken language translation; Utterance understanding; Spoken language parsing; Human-computer interaction