位置:成果数据库 > 期刊 > 期刊详情页
汉英双语命名实体识别与对齐的交互式方法
  • ISSN号:0254-4164
  • 期刊名称:计算机学报
  • 时间:2011
  • 页码:1688-1696
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]中国科学院自动化研究所模式识别国家重点实验室,北京100190, [2]台湾致遠科技公司,台湾新竹
  • 相关基金:本课题得到国家自然科学基金(60975053,60736014)、国家支撑计划项目(2006BAH03802)和国家“八六三”高技术研究发展计划项目基金(2006AA010108-4)资助.
  • 相关项目:基于映射关系理解的实体翻译方法及应用研究
中文摘要:

基于汉英双语命名实体的识别与对齐特性,文中提出了一种双语命名实体交互式对齐模型,其中的修正对齐计算体现了汉英实体识别与对齐的密切结合:一方面,利用双语对齐信息帮助实体识别;另一方面,实体的对齐过程对实体的识别结果又具有一定的修正作用,两方面的结合实现了双语实体识别与对齐之间的交互式互助过程.实验证明,这种交互式对齐模型不仅显著提高了汉英实体对齐的性能(F值从74.4%提高到81.2%),而且有效地提高了汉英实体识别的正确率和召回率.

英文摘要:

Named entity (NE) recognition is an essential early stage and has long been a thorny problem in many natural language processing pipelines. Generally, bilingual named entity recog nition and alignment are processed sequentially and independently, regardless of interactions between the two stages. Therefore, NE recognition errors are propagated and compounded in NE alignment stage. Actually, bilingual alignment information, other than monolingual information, provides further indications for NE recognition. It is necessary to capture the interactions be- tween NE recognition and alignment. Accordingly, based on the characteristics of NE recognition and alignment, this paper proposes an interactive bilingual NE alignment model, which combines basic alignment and corrective alignment. Basic alignment is achieved as traditional alignment approach, while the corrective alignment realizes the joint of NE recognition and alignment. On the one hand, bilingual alignment information is utilized for NE recognition; on the other hand, NE recognition errors can be recovered in the NE alignment stage. Both the NE boundaries and type can be corrected in such interactive NE alignment model. The experiments show that this novel model not only achieves a significant improvement of the Chinese-English NE alignment quality (F-score from 74.4% to 81.2%), but also improves the performance of NE recognition.

同期刊论文项目
期刊论文 10 会议论文 26 专利 2
期刊论文 77 会议论文 94 专利 4 著作 2
同项目期刊论文
期刊信息
  • 《计算机学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国计算机学会 中国科学院计算技术研究所
  • 主编:孙凝晖
  • 地址:北京中关村科学院南路6号
  • 邮编:100190
  • 邮箱:cjc@ict.ac.cn
  • 电话:010-62620695
  • 国际标准刊号:ISSN:0254-4164
  • 国内统一刊号:ISSN:11-1826/TP
  • 邮发代号:2-833
  • 获奖情况:
  • 中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 美国数学评论(网络版),荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:48433