位置:成果数据库 > 期刊 > 期刊详情页
口语对话中冗余词汇识别方法研究
  • 期刊名称:中文信息学报
  • 时间:0
  • 页码:104-111
  • 语言:中文
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]中国科学院自动化研究所模式识别国家重点实验室,北京100190
  • 相关基金:国家自然科学基金资助项目(60975053, 61003160, 60736014); 中国科学院对外合作交流项目; 中国新加坡数字媒体研究院资助
  • 相关项目:融合语言知识与统计模型的机器翻译方法研究
中文摘要:

冗余现象是口语对话中普遍存在的特殊语言现象之一,它的存在常常会影响口语句子的理解和翻译。该文基于真实口语对话语料对冗余现象进行了分析,并在词汇层面对冗余现象进行了分类,然后对口语中的冗余词汇进行了统计识别方法研究。通过对冗余词汇处理前后的口语句子翻译实验,结果表明,预先对冗余现象进行处理,能够改善口语翻译的译文质量。

英文摘要:

Fillers and redundancy are the most common phenomena in spoken dialogs.It always influences the results of spoken language understanding and translation system.Based on the analysis and statistical classification of fillers in lexical level of spoken dialog corpus,we propose statistical methods to recognize the fillers.Experiments on translation of the spoken sentences before and after processing of the fillers have been conducted.The experimental results have shown that the performance of spoken language translation system is significantly improved if the fillers are processed before translating.

同期刊论文项目
期刊论文 77 会议论文 94 专利 4 著作 2
期刊论文 10 会议论文 26 专利 2
同项目期刊论文