位置:成果数据库 > 期刊 > 期刊详情页
一种基于Web的大规模人物社会关系提取方法
  • ISSN号:1003-6059
  • 期刊名称:《模式识别与人工智能》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]北京大学网络与分布式系统实验室,北京100871
  • 相关基金:国家自然科学基金资助项目(No.60435020,60573166,60603056)
中文摘要:

Web上的人物社会关系是一类重要的Web信息.本文提出一种轻量级的大规模人物社会关系提取方法,并引入模拟退火方法,迭代发掘网页中蕴涵的表述人物社会关系的最小描述模式集合.利用Web信息冗余性,高效准确地从Web上提取人物关系信息.为验证本文方法的有效性,定义6种人物社会关系,基于1张大规模Web人名列表,对这6种关系进行提取.实验结果表明本文方法的平均准确率为84.79%,平均召回率为81.69%.

英文摘要:

Web information about social relations of persons is an important type of information on the Web. A lightweight method for extracting large-scale information of social relations of persons is proposed. The minimum descriptive patterns which are used to describe the social relations in web pages are mined from the web with the help of the simulated annealing method. The descriptive patterns are also used to extract more social relations of persons from the web by the redundancy of the web. Six types of social relations are defined to test the proposed method, and each type of the relations is extracted from a specified person name list, which is created from the web. The experimental result shows the average precision and recall of the proposed method are 84.79% and 81.69% respectively.

同期刊论文项目
期刊论文 7 会议论文 2
同项目期刊论文
期刊信息
  • 《模式识别与人工智能》
  • 中国科技核心期刊
  • 主管单位:中国科学技术协会 中国自动化学会
  • 主办单位:国家智能计算机研究开发中心 中国科学院合肥智能机械研究所
  • 主编:郑南宁
  • 地址:安徽省合肥市蜀山湖路350号中国科学院合肥智能机械研究所
  • 邮编:230031
  • 邮箱:bjb@iim.cas.cn
  • 电话:0551-5591176
  • 国际标准刊号:ISSN:1003-6059
  • 国内统一刊号:ISSN:34-1089/TP
  • 邮发代号:26-69
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:10169