位置:成果数据库 > 期刊 > 期刊详情页
面向网络大数据的知识融合方法综述
  • ISSN号:0254-4164
  • 期刊名称:《计算机学报》
  • 时间:0
  • 分类:TP393[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]中国科学院信息工程研究所,北京100093, [2]中国科学院计算技术研究所,北京100190
  • 相关基金:国家科技支撑计划(2012BAH46B03); 核高基项目(2013ZX01039-002-001-001); 国家重点研发计划(2016YFB1000902); 国家自然科学基金(61602467,61303056,61402442,61402464,61572469,61572473,61502478); 北京市自然科学基金项目(4154086)资助
中文摘要:

网络大数据是指"人、机、物"三元世界在网络空间中交互、融合所产生并在互联网上可获得的大数据.网络大数据中蕴含丰富的知识资源,包括描述特定事物的实体、刻画实体逻辑联系的关系、用于语义标注实体的分类等.知识自身呈现出异质性、多元性和碎片化等特点.如何在网络大数据环境下海量碎片化的数据中提取出能够用于解决问题的知识,并对知识进行有效的融合计算,将从网络大数据中获得的知识有效组织起来是知识库构建亟待解决的技术难点和当前研究的热点.该文从知识融合的定义出发,介绍近年来的可用于知识融合的技术和算法的最新进展,通过分类和总结现有技术,为进一步的研究工作提供可选方案.文中首先介绍了在知识融合中用于判断知识真伪的知识评估的若干研究和评估方法;然后基于知识评估的结果,从实体扩充、关系扩充和分类扩充3个方面详细总结了知识融合中各种可用的知识扩充方法和研究进展;探讨了应用于网络大数据的知识融合的总体框架;基于这些讨论,总结面向网络大数据的知识融合面临的主要挑战和可能解决方案,并展望了该技术未来的发展方向与前景.

英文摘要:

Network big data refers to the massive data generated via interaction and fusion of the ternary human-machine-thing universe in the cyberspace and available on the Internet.There is a large amount of knowledge elements in big data,such as entities representing specific objects,relations depicting logic connections between entities,classes annotating entities semantics,etc.The very fast development of knowledge in big data environment has presented the characteristics of heterogeneity,variety and fragmentation.How to extract and fuse knowledge from large and fragmented data,to effectively organize the knowledge elements obtained from the big data,have become a technical difficulty to solve and also a hot research topic in knowledge base construction.This paper presents a survey on the techniques and algorithms of knowledge fusion in decades,and expects to provide alternative options for further research by analyzing the existing methods.Firstly,the most commonly knowledge evaluation methods used to judge the authenticity of knowledge in knowledge fusion are introduced.Secondly,the research progress of knowledge population is reviewed in detail from entity population,relation population and taxonomy populationaspects.Thirdly,the overall framework of knowledge fusion is discussed.Finally,this paper summarizes the key challenges and possible solutions,and further gives a future outlook on the research of knowledge fusion for network big data.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国计算机学会 中国科学院计算技术研究所
  • 主编:孙凝晖
  • 地址:北京中关村科学院南路6号
  • 邮编:100190
  • 邮箱:cjc@ict.ac.cn
  • 电话:010-62620695
  • 国际标准刊号:ISSN:0254-4164
  • 国内统一刊号:ISSN:11-1826/TP
  • 邮发代号:2-833
  • 获奖情况:
  • 中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 美国数学评论(网络版),荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:48433