本课题研究如何使用新型机器学习方法(包括半监督学习、主动学习等)更好地实现社会网络分析中的链接预测任务。课题调查了机器学习技术在社会网络分析领域(尤其是链接预测子任务)中应用的研究现状和存在问题,分析了将半监督学习、主动学习思想应用于链接预测的必要性和可能性。课题拟展开的研究工作1)研究基于半监督学习的链接预测方法;2)基于主动学习的链接预测方法;3)基于半监督和主动学习的链接分类方法。实验采用DBLP数据集和CORA数据集,在WEKA环境下实现所有的算法。课题将提出的方法与国际上已有的相关方法进行比较,验证课题的有效性与先进性,并提供算法的理论支持。研究成果对于垃圾邮件过滤系统、无线通信网络安全系统和网络个性化推荐系统均有重要的意义。课题有望在国内外知名期刊、会议上发表6篇以上论文,培养研究生1-2名。
link prediction;semi-supervised learning;active learning;dynamic network;location-based network
随着网络的大规模应用,网络数据分析与挖掘受到很大的关注。链接预测是社会网络分析的关键问题,研究如何从已知网络中预测出可能的新链接。目前,链接预测面临的主要挑战包括网络稀疏性问题、网络动态性问题以及网络数据规模较大的问题。本项目对链接预测需要解决的关键问题进行了深入地研究,提出了1)基于半监督学习的链接预测方法;2)采用主动学习的链接预测方法;3)动态网络中的链接预测方法;4)基于位置网络的链接预测方法。在理论和仿真实验中分析比较了所提出方法与基准方法的准确率和性能。本项目的研究取得了预期的成果,共发表论文20余篇,其中SCI检索3篇,EI检索15篇;申请专利 2项;培养硕士生6名。