东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

利用Markov网络抽取复述增强机器译文自动评价方法

ISSN号：1003-0077
期刊名称：中文信息学报
时间：2015.9.1
页码：136-142
分类：TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：江西师范大学计算机信息工程学院,江西南昌330022
相关基金：国家自然科学基金（61163006,61203313,61462044,61272212）; 国家语委“十二五”规划（YB125-99）; 江西省自然科学基金（20132BAB201030,20151BAB207025）; 江西省研究生创新基金（YC2014-S149）
相关项目：基于语言理解的机器翻译译文自动评价方法研究

作者：翁贞|李茂西|王明文|

关键词：复述, 机器译文自动评价, MARKOV网络, 相关性, paraphrase, automatic evaluation of machine translation, Markov network, correlation

中文摘要：

在机器译文自动评价中,匹配具有相同语义、不同表达方式的词或短语是其中一个很大的挑战。许多研究工作提出从双语平行语料或可比语料中抽取复述来增强机器译文和人工译文的匹配。然而双语平行语料或可比语料不仅构建成本高,而且对少数语言对难以大量获取。我们提出通过构建词的Markov网络,从目标语言的单语文本中抽取复述的方法,并利用该复述提高机器译文自动评价方法与人工评价方法的相关性。在WMT14 Metrics task上的实验结果表明,我们从单语文本中提取复述方法的性能与从双语平行语料中提取复述方法的性能具有很强的可比性。因此,该文提出的方法可在保证复述质量的同时,降低复述抽取的成本。

英文摘要：

It is a challenge to match the different expressions （words or phrases） which have the same meanings in the automatic evaluation of machine translation. Many researchers proposed to enhance the matches between the words in machine translation and in human references by extracting paraphrases from bilingual parallel corpus or comparable corpus. However, the cost of constructing the bilingual parallel corpus or the comparable corpus is high; furthermore, it is difficult to obtain a large corpus between some language pairs. In this paper, the paraphrases are extracted from the monolingual texts in the target language by constructing the Markov networks of words, and applied to improve the correlation between the results of automatic evaluation and the human judgments of machine translation. The experimental results on WMT14 Metrics task showed that the performances of the proposed approach of extracting paraphrase from monolingual text are comparable to that of extracting paraphrase from bilingual parallel corpus.

同期刊论文项目

文本自动分类中样本重要性模型及应用研究

期刊论文 19

大规模数据聚类的并行进化算法骨架研究

期刊论文 33 会议论文 4

基于语言理解的机器翻译译文自动评价方法研究

期刊论文 15 会议论文 2

基于深度学习的机器译文质量估计方法研究

期刊论文 3

同项目期刊论文

投影寻踪模型中投影指标的改进

结合语义的位置语言模型

A Global Stereo Matching Algorithm Based on Adaptive Support-Weight and Graph Cut

基于MapReduce的可扩展协同聚类算法

Using Semantic Constraints for Question Answering

基于ListMLE排序学习方法的机器译文自动评价研究

Web Application Integration Framework Based on OSGi

一种基于簇相合性的文本增量聚类算法

面向近邻搜索的马尔科夫图哈希算法

基于词项—句子—文档三层图模型的多文档自动摘要

Local similarity preserved hashing learning via Markov graph for efficient similarity search

基于样本重要性原理的KNN文本分类算法

大量类别下非纹理对象实时检测与识别

基于迭代方法的多层Markov网络信息检索模型

一种基于族相合性的文本增量聚类箅法

基于 Markov 随机游走的渐进式半监督分类模型

基于词项一句子一文档三层图模型的多文档自动摘要

协同过滤中一种项目综合相似度计算方法

基于Markov随机游走的渐进式半监督分类模型

基于文档团的Markov网络检索模型

A SaaS Development Platform based on Cloud Computing

结合邻近度的语义位置语言检索模型

基于MapReduce的粒子群投影寻踪模型的设计与实现

结合全局和局部信息的特征选择算法

面向新闻的情感关键句抽取与判定

中文微博句子倾向性分类中特征抽取研究

基于词项-句子-文档三层图模型的多文档自动摘要

基于ListMLE排序学习方法的机器译文自动评价研究

基于词项—句子—文档三层图模型的多文档自动摘要

基于样本重要性原理的KNN文本分类算法

基于迭代方法的多层Markov网络信息检索模型

Modeling Monolingual Character Alignment for Automatic Evaluation of Chinese Translation

机器译文自动评价中基于IHMM的近义词匹配方法研究

协同过滤中一种项目综合相似度计算方法

结合邻近度的语义位置语言检索模型

面向新闻的情感关键句抽取与判定

中文微博句子倾向性分类中特征抽取研究

基于ListMLE排序学习方法的机器译文自动评价研究

基于词项—句子—文档三层图模型的多文档自动摘要

基于样本重要性原理的KNN文本分类算法

基于迭代方法的多层Markov网络信息检索模型

机器译文自动评价中基于IHMM的近义词匹配方法研究

协同过滤中一种项目综合相似度计算方法

基于文档团的Markov网络检索模型

跨语言信息检索中的双语主题相关模型

结合全局和局部信息的特征选择算法

面向新闻的情感关键句抽取与判定

中文微博句子倾向性分类中特征抽取研究

杂乱背景和摄像机移动下的时空兴趣点检测

基于多层Markov网络的信息检索模型

单节点的无线传感器网络数据传输优化策略

基于查询相关的近邻语言模型

衔接性驱动的篇章一致性建模研究

Corpus-based research on English word recognition rates in primary school and word selection strategy

机器译文自动评价中基于IHMM的近义词匹配方法研究

基于word2vec的大中华区词对齐库的构建

期刊信息

《中文信息学报》
北大核心期刊（2011版）

主管单位:中国科学技术协会
主办单位:中国中文信息学会中国科学院软件研究所
主编：孙茂松
地址：北京海淀中关村南四街4号中科院软件所
邮编：100190
邮箱：jcip@iscas.ac.cn
电话：010-62562916

国际标准刊号：ISSN：1003-0077
国内统一刊号：ISSN：11-2325/N
邮发代号:

获奖情况:

国内外数据库收录:
日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:9136