位置:成果数据库 > 期刊 > 期刊详情页
基于转换和映射的语义单元自动获取
  • ISSN号:1002-0470
  • 期刊名称:《高技术通讯》
  • 时间:0
  • 分类:TP311.13[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术] TH122[机械工程—机械设计及理论]
  • 作者机构:[1]大连理工大学计算机科学与工程系,大连116024
  • 相关基金:863计划(2006AA01Z140)资助项目.
中文摘要:

提出了一种基于转换和映射的英汉双语语料的语义单元自动获取方法,即构造一套规则系统对英语句子的链语法分析结果进行处理,以设定单词的语义层次并转换生成语义单元的英语表示(ESER);然后利用统计双语词对齐将之映射为语义单元的汉语表示(CSER),从而获得双语语义单元;最后通过语义单元表示实量竞争、合并以及召回等一系列策略对自动获取结果进行优化。该方法能够在缺少完全语义分析的情况下实现语义单元的自动获取。实验结果表明双语语义单元自动获取的F值达到了74.06%,基于语义单元的机器翻译系统具有准确率高的特点。

英文摘要:

The paper proposes an approach to automatic extraction of semantic elements (SEs) from the English-Chinese bilingual parallel corpus. Its work consists of three parts: first, constructing a set of rules from the chain of English sentences parsed by the link parser to detennine the relative logical hierarchy of each word to generate the English semantic element representation (ESER) based on the transfonnational algorithm, then, mapping the ESER into the Chinese semantic element representation (CSER) according to the statistical word alignment so as to obtain bilingual semantic element representations (SERs), finally, extracting SEs by optimizing the bilingual SERS through a series of strategies like SERs competition, unaligned word pair recall. This approach can extract SEs without complete semantic analysis from the bilingual parallel corpus. The experiments showed that the F-measure of SE extraction reached 74.06 % and the SE based machine translation systems featured in their high accuracy.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《高技术通讯》
  • 北大核心期刊(2011版)
  • 主管单位:中华人民共和国科学科技部
  • 主办单位:中国科学技术信息研究所
  • 主编:赵志耘
  • 地址:北京市三里河路54号
  • 邮编:100045
  • 邮箱:hitech@istic.ac.cn
  • 电话:010-68514060 68598272
  • 国际标准刊号:ISSN:1002-0470
  • 国内统一刊号:ISSN:11-2770/N
  • 邮发代号:82-516
  • 获奖情况:
  • 《中国科学引文数据》刊源,《中国科技论文统计与分析》刊源
  • 国内外数据库收录:
  • 美国化学文摘(网络版),荷兰文摘与引文数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),英国英国皇家化学学会文摘
  • 被引量:12178