位置:成果数据库 > 期刊 > 期刊详情页
异构信息空间中实体关联关系挖掘算法CFRQ4A
  • ISSN号:1000-1239
  • 期刊名称:计算机研究与发展
  • 时间:2014.4.15
  • 页码:895-904
  • 分类:TP311.13[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]东北大学信息科学与工程学院,沈阳110004, [2]辽宁科技大学软件学院,辽宁鞍山114044
  • 相关基金:国家“九七三”重点基础研究发展计划基金项目(2012CB316201);国家自然科学基金面上项目(61033007,61003060);中央高校基本科研业务费专项资金项目(N100704001,N110404007);高等学校博士学科点专项科研基金项目(20120042110028);教育部-英特尔信息技术专项科研基金项目(MOE-INTEL-2012-06)
  • 相关项目:数据密集型计算环境下的数据管理方法与技术
中文摘要:

丰富的实体关联关系是在异构信息空间中进行数据分析、数据挖掘、知识发现和语义查询等许多应用的前提条件和关键所在.然而不同于同构信息网络,由于异构信息空间中实体关联关系的复杂性、多样性和异构性使得实体关联关系挖掘并不是一件简单的任务,更具有挑战性.以作者文献网络为例,提出了一个通用的,由聚类、过滤、推理和量化4步骤组成的异构信息空间中基于聚类的实体关联关系挖掘算法CFRQ4A(clustering,filtering,reasoning and qualifying for associations).CFRQ4A算法不仅利用了异构实体自身的属性值,还利用了异构信息网络的结构(路径)信息;在挖掘过程中引入关联关系约束来保证关联关系的语义和逻辑正确性,并且针对实体关联关系的特点提出了关联强度量化模型.在真实数据集DBLP上的实验结果表明所提出算法是可行和有效的.

英文摘要:

The rich entity associations are prerequisites and play important roles in many applications such as data analyzing,data mining,knowledge discovery and semantic query in heterogeneous information spaces.However unlike homogeneous information network,due to the complexity,diversity and heterogeneous of entity associations in heterogeneous information spaces,the entity association mining is not a simple task and with more challenges.It is taken as an example to discover the likely entity associations among heterogeneous entities in an author bibliographic network.In particular,aiming at the characteristics of heterogeneous information spaces,a new general 4-step entity association mining algorithm CFRQ4A (clustering,filtering,reasoning and quantifying for associations) is proposed.CFRQ4A leverages not only attribute values of heterogeneous entities but also structural (path) information of heterogeneous information network.And association constraints are introduced to verify semantic and logic correctness of entity associations in the mining process.The purpose of the filtering step is to further reduce the searching space of the mining algorithm.Moreover,aiming at the inherent features of entity association,a reasonable association strength quantifying model is given.Experimental results on the DBLP dataset demonstrate the feasibility and effectiveness of the proposed algorithm.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机研究与发展》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院计算技术研究所
  • 主编:徐志伟
  • 地址:北京市科学院南路6号中科院计算所
  • 邮编:100190
  • 邮箱:crad@ict.ac.cn
  • 电话:010-62620696 62600350
  • 国际标准刊号:ISSN:1000-1239
  • 国内统一刊号:ISSN:11-1777/TP
  • 邮发代号:2-654
  • 获奖情况:
  • 2001-2007百种中国杰出学术期刊,2008中国精品科...,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,荷兰文摘与引文数据库,美国工程索引,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:40349