位置:成果数据库 > 期刊 > 期刊详情页
多语言机译系统中高质量语义单元库形成方法
  • ISSN号:2095-9389
  • 期刊名称:《工程科学学报》
  • 时间:0
  • 分类:TP391.1[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]北京科技大学信息工程学院,北京100083
  • 相关基金:国家高技术研究发展计划资助项目(No.2006AA012140,No.2006AA010101);国家自然科学基金资助项目(No.60736014)
中文摘要:

讨论构建多自然语言互译机译系统所需的高质量、可扩充、完备的、无可弃、无重复、无非正常歧义的多语统一语义单元知识库.在构建过程中采用类型特征分类方法有效降低计算复杂性,使去重复的计算量降低一半,去可弃的计算量降到O(βN)(N是语义单元库规模,β是有界数,β〈C,C是常数).全部算法都可以在多核处理机上以常数效率地实现.同时讨论了语义单元的再分解和自然语言种类的增多时语义单元知识库的扩充方法.该知识库不仅用于多自然语言互译系统,还可作为自然语言理解和处理的基础知识库.

英文摘要:

Building up a high-quality, expandable, complete, free-discardable, free-of-repetition and free-of-abnormal-ambiguity multi-language semantic unit knowledge base for a multi-language machine translation system was discussed. In the process of buildup, the type feature classification method was adopted o effectively reduce the calculation complexity, make the calculation for repetition removal reduced by half, and reduce the trash-removal calculation to O (βN), where N is the scale of the semantic unit knowledge base, fl is bounded, β〈 C and C is a constant. All algorithms can be concurrently realized on a multi-core processor in constant efficiency. Furthermore, the reecomposition of a semantic unit and the expansion methods for the semantic unit knowledge base in case of natural language type increase were also discussed. This knowledge base can be used not only for the multi-language machine translation system but also as the basic knowledge base for natural language understanding and processing.

同期刊论文项目
期刊论文 77 会议论文 94 专利 4 著作 2
同项目期刊论文
期刊信息
  • 《工程科学学报》
  • 北大核心期刊(2011版)
  • 主管单位:中华人民共和国教育部
  • 主办单位:北京科技大学
  • 主编:张欣欣
  • 地址:北京市海淀区学院路30号
  • 邮编:100083
  • 邮箱:xuebaozr@ustb.edu.cn
  • 电话:010-62332875
  • 国际标准刊号:ISSN:2095-9389
  • 国内统一刊号:ISSN:10-1297/TF
  • 邮发代号:82-303
  • 获奖情况:
  • 首届国家期刊奖,第二届全国优秀科技期刊评比一等奖,全国高等学校自然科学学报系统优秀学报评比一等奖,中国期刊方阵“双高”期刊
  • 国内外数据库收录:
  • 日本日本科学技术振兴机构数据库,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:392