位置:成果数据库 > 期刊 > 期刊详情页
基于数据挖掘的网络链接预测研究
  • ISSN号:1671-1122
  • 期刊名称:《信息网络安全》
  • 时间:0
  • 分类:TP393[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]北京语言大学信息科学学院,北京100083, [2]中国科学院计算技术研究所,北京100190
  • 相关基金:国家自然科学基金[60873166] ;北京市自然科学基金[4122076]
作者: 徐燕[1,2]
中文摘要:

近年来社交网络日益火热,基于社交网络的数据挖掘也随之兴起。链接预测作为网络数据挖掘的重要课题,其借助已知的网络结构等信息来预测和估计尚未链接的两个节点间存在链接的可能性。社交网络的链接预测可以用于好友推荐,过滤冗余信息,提高用户的满意度、忠诚度,建立一个健康的社交网络环境。已有的链接预测算法集中研究网络结构信息或网络节点属性,以分析网络全局或局部特性。文章考虑到微博社交网络的本质,提出了融合多特征的链接预测方法,其中包括节点特征、拓扑特征、社交特征以及投票特征。基于这些特征,在微博社交网络数据上应用SVM、朴素贝叶斯、随机森林和逻辑回归4种机器学习算法训练预测模型,预测潜在的社交链接。结果表明,文章提出的组合特征相对于传统特征表现更好,且融合多种特征能够提高最终的预测精度。

英文摘要:

In recent years,social networks have become increasingly hot,and data mining basedon social networks has also arisen.Link prediction(LP)is an important topic of network data mining,which uses the known network structure and other information to predict and estimate the possibilityof linking between two nodes that are not yet linked.Link prediction in social network can be usedto recommend friends,fi lter redundant information,improve user’s satisfaction and loyalty,and builda healthy social networking environment.In previous researches,attentions are focused on structureinformation or node attributes,in order to analyze the global or local properties.Considering the naturesof microblog social network,this paper proposes a link prediction method combining multiple featureswhich includes node features,topological features,social features and voting features.Based on thesefeatures,4machine learning algorithms,SVM,naive Bayes,random forest and logical regression,areapplied on microblog social network data to train predictive models to predict potential social links.The results show that combining multiple features performs better than the traditional features,and thecombination of multiple features can achieve highest accuracy.

同期刊论文项目
期刊论文 8 会议论文 14
同项目期刊论文
期刊信息
  • 《信息网络安全》
  • 主管单位:中华人民共和国公安部
  • 主办单位:公安部第三研究所 中国计算机学会 计算机安全专业委员会
  • 主编:关非
  • 地址:北京市海淀区阜成路58号新洲商务大厦301B
  • 邮编:100142
  • 邮箱:gassbj@163.com
  • 电话:010-88114408 88111078 88118778
  • 国际标准刊号:ISSN:1671-1122
  • 国内统一刊号:ISSN:31-1859/TN
  • 邮发代号:4-688
  • 获奖情况:
  • 万方,同方,维普
  • 国内外数据库收录:
  • 被引量:6058