位置:成果数据库 > 期刊 > 期刊详情页
WNCT:一种WordNet概念自动翻译方法
  • ISSN号:1003-0077
  • 期刊名称:《中文信息学报》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]中国科学院计算技术研究所智能信息处理重点实验室,北京100190, [2]中国科学院研究生院,北京100049
  • 相关基金:国家自然科学基金资助项目(60496326,60573063,60573064);国家863计划资助项目(2007AA01Z325)
中文摘要:

WordNet是在自然语言处理领域有重要作用的英语词汇知识库,该文提出了一种将WordNet中词汇概念自动翻译为中文的方法。首先,利用电子词典和术语翻译工具将英语词汇在义项的粒度上翻译为中文;其次,将特定概念中词汇的正确义项选择看作分类问题,归纳出基于翻译唯一性、概念内和概念间翻译交集、中文短语结构规则,以及基于PMI的翻译相关性共12个特征,训练分类模型实现正确义项的选择。实验结果表明,该方法对WordNet3.0中概念翻译的覆盖率为85.21%,准确率为81.37%。

英文摘要:

WordNet is an important English lexical semantic knowledge base. This paper presents a method for the automatic translation of the synsets in the WordNet into Chinese, named as WNCT. Firstly, WNCT uses dictionaries and term translation tools to translate the senses of English words in the WordNet into Chinese. Then WNCT regards the selection for correct sense of the words in a synset as a classification issue. The classification model is then trained by 12 features extracted according to the uniqueness of translation, the translation intersections within and between the concepts, the construction rules for Chinese phrase as well as PMI based translation relevance. Ex perimental results show that WNCT achieve 85.21% coverage rate and 81.37 % accuracy for the Chinese translation of the synsets in WordNet 3.0.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《中文信息学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国中文信息学会 中国科学院软件研究所
  • 主编:孙茂松
  • 地址:北京海淀中关村南四街4号中科院软件所
  • 邮编:100190
  • 邮箱:jcip@iscas.ac.cn
  • 电话:010-62562916
  • 国际标准刊号:ISSN:1003-0077
  • 国内统一刊号:ISSN:11-2325/N
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:9136