位置:成果数据库 > 期刊 > 期刊详情页
基于社会网络的跨文本同名消歧
  • ISSN号:1003-0077
  • 期刊名称:中文信息学报
  • 时间:2011.9.9
  • 页码:75-82
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]北京大学计算语言学教育部重点实验室,北京100871, [2]北京大学信息化建设与管理办公室,北京100871
  • 相关基金:高校博士点专项基金资助项目(20090001110047); 国家自然科学基金资助项目(60973053,91024009)
  • 相关项目:基于互联网的突发事件信息动态检测、抽取与融合技术研究
作者: 陈晨|王厚峰|
中文摘要:

跨文本人名消歧是判断出现在不同文本的相同人名是否指称现实中相同实体的过程。跨文本人名消歧是准确获取感兴趣人物相关信息的基础,对多文本摘要、信息融合等具体应用也有重要的作用。该文运用社会网络分析法消歧中文不同文本同名歧义问题,思想是先使用谱聚类对社会网络中的人名聚类,然后根据不同社会网络边权值和不同图划分准则对人名消歧效果的影响,引入了模块度阈值作为社会网络划分的停止条件。在CLP2010的中文人名消歧数据上进行测试,显示了社会网络分析对人名消歧的有效性。

英文摘要:

Cross-document personal name disambiguation is the process of determining if an identical name occurring in different texts refers to the same person in the real world.With the increasing need for multi-document applications,for example,multi-document summarization and information fusion,cross-document name entity disambiguation has drawn much attention.This paper employs a social network based algorithm for cross-document personal name disambiguation.This method uses the spectral clustering approach,compares the results of different graph partition criteria,and chooses the modularity threshold as the stopping measure for graph partition.Experiments datasets are built by CLP 2010 Chinese personal name disambiguation task.The results show that this method is promissing.

同期刊论文项目
期刊论文 16 会议论文 15 专利 2
同项目期刊论文
期刊信息
  • 《中文信息学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国中文信息学会 中国科学院软件研究所
  • 主编:孙茂松
  • 地址:北京海淀中关村南四街4号中科院软件所
  • 邮编:100190
  • 邮箱:jcip@iscas.ac.cn
  • 电话:010-62562916
  • 国际标准刊号:ISSN:1003-0077
  • 国内统一刊号:ISSN:11-2325/N
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:9136