位置:成果数据库 > 期刊 > 期刊详情页
汉英双语词典的自动构建技术研究
  • ISSN号:1000-0135
  • 期刊名称:《情报学报》
  • 时间:0
  • 分类:G250.73[文化科学—图书馆学]
  • 作者机构:[1]中国科学技术信息研究所,北京100038
  • 相关基金:中国博士后科学基金资助项目(编号:20100470392); 中国科学技术信息研究所预研基金项目“多语言科技文献术语抽取及匹配的理论与方法研究”(编号:YY-2010019);中国科学技术信息研究所学科建设重点工作项目(编号:2009KP01-3-3)资金支持; 国家科技支撑计划项目(编号:2006BAH03B02)
中文摘要:

汉英词典作为沟通中文与英语两种不同语言的桥梁,是中国与世界交流的工具。在信息时代飞速发展的今天,双语词典的自动构建技术在机器翻译和跨语言检索领域起着重要的作用,本文对双语词典的自动构建方法和其中的关键技术进行了比较全面的分析和总结,并提出一种从汉英平行语料库中抽取双语词语,自动构建双语词典的方法,在实现汉英句子级对齐后,对双语语料分别进行分词和词性标注处理,通过抽取汉英词语单元并计算其关联概率来实现汉英的词语对齐,最终生成双语词典。该方法在对真实语料的双语词典构建实验中取得了较好的结果,词对齐效果优于传统的IBM模型方法。

英文摘要:

Chinese-English bilingual dictionary is a communication tool between China and the world.With the rapid development of information age,the automatic construction of bilingual dictionaries plays an important role in the area of machine translation and cross-language retrieval.The method of automatic construction of bilingual dictionary and the key technologies are comprehensive analysis and summary in this paper.It proposes a way of automatic bilingual dictionaries that terms are collected from parallel corpus.Parallel corpora are first aligned,and tagged with their part-of-speech categories respectively.Through Chinese-English word units extracting,the associated probability between every Chinese word unit and its English word unit is calculated.Eventually a bilingual dictionary is generated.A better performance is obtained in the experiments of bilingual dictionary construction on real corpora,and the result of words alignment is better than traditional IBM model method.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《情报学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国科学技术情报学会 中国科学技术信息研究所
  • 主编:戴国强
  • 地址:北京复兴路15号
  • 邮编:100038
  • 邮箱:qbxb@istic.ac.cn
  • 电话:010-68598273
  • 国际标准刊号:ISSN:1000-0135
  • 国内统一刊号:ISSN:11-2257/G3
  • 邮发代号:82-153
  • 获奖情况:
  • 1992年全国优秀科技期刊评比二等奖,1997年中国科协优秀科技期刊三等奖,被国外4种检索工具录用
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国人文社科核心期刊,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:19778