位置:成果数据库 > 期刊 > 期刊详情页
基于部分平行Web语料的自动术语翻译
  • ISSN号:1000-0135
  • 期刊名称:《情报学报》
  • 时间:0
  • 分类:G633.63[文化科学—教育学] TP311.13[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]天津大学计算机科学与技术学院,天津300072, [2]天津城市建设学院电子与信息工程系,天津300384
  • 相关基金:本文由国家自然科学基金(项目批准号:60603027)资助.
中文摘要:

不借助于任何辞典工具而从Web中自动挖掘出术语的翻译,这是一项有趣且富有挑战性的工作。本文提供了一种基于部分平行Web语料的自动术语翻译方法。首先通过一个术语对,采用Web挖掘技术,获取潜在的匹配模式。接着,在用户对源术语进行翻译时,利用已获取的模式来抽取候选答案集,最后依据评分函数,对候选答案进行排序,并将结果以格式化的形式反馈给用户:本文依据三条层次规则,构造了候选答案的评分函数。实验结果表明,本文所构造的评分函数客观反映了不同匹配模式的不同重要性,且基于部分平行Web语料的方法能够很好地发现源术语的正确翻译,优于现有的技术方案。

英文摘要:

To find the translation of a given terminology from web without any dictionary is an interesting and challengeable work. This paper presents a new automatic terminology translation method based on partially-parallel web corpus. It first uses only a pair of terminologies to get the initial matching patterns through web mining technology. On translating a source terminology, it uses these patterns previously obtained to extract some candidate answers, and then ranks them according to the scoring function and returns them to user in a specified format. This paper establishes three heuristic rules to construct the scoring function for evaluating the reliability of candidate answers. The experimental results indicate that this scoring function objectively reflects the different importance of various matching patterns, and this method provided by this paper can well find the translations of source terminologies and is better than the existing systems.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《情报学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国科学技术情报学会 中国科学技术信息研究所
  • 主编:戴国强
  • 地址:北京复兴路15号
  • 邮编:100038
  • 邮箱:qbxb@istic.ac.cn
  • 电话:010-68598273
  • 国际标准刊号:ISSN:1000-0135
  • 国内统一刊号:ISSN:11-2257/G3
  • 邮发代号:82-153
  • 获奖情况:
  • 1992年全国优秀科技期刊评比二等奖,1997年中国科协优秀科技期刊三等奖,被国外4种检索工具录用
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国人文社科核心期刊,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:19778