位置:成果数据库 > 期刊 > 期刊详情页
基于最大熵的维吾尔语句子边界识别模型
  • 期刊名称:计算机工程 已录用
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]上海交通大学计算机科学与工程系,上海200240, [2]新疆大学信息科学与工程学院,新疆乌鲁木齐830046
  • 相关基金:国家社会科学基金重点资助项目(10AYY006); 国家自然科学基金资助项目(60663006); 国家工信部电子发展基金资助项目(工信部财(2009)453)
  • 相关项目:面向汉维机器翻译的双语对齐语料库和短语库构建技术的研究
中文摘要:

在基于实例的维吾尔语汉语机器翻译系统中维吾尔语相似度计算起重要作用。维吾尔语的黏着性特性要求对单词进行词干提取。本文提出的方法结合简单的句子结构相似度计算方法,通过对单词词干提取进行句子相似度计算。小规模实验结果比较接近人工评价的句子相似度。

英文摘要:

Uyghur sentence similarity computation plays an important role in Example Base Machine Translation.The characteristic of agglutination of Uyghur language requires stemming.This paper presents the method that computes Uyghur sentence similarity after stemming words and combines it with a naive sentence structure similarity computation method.The small-scale experimental result shows that it is close to human evaluation.

同期刊论文项目
同项目期刊论文