本申请以微博媒体为例,研究面向大规模社会网络的分析技术。针对微博媒体的两种实体(用户、资源)的表示问题,定义了一种基于XML格式的实体描述文件,然后在微博文档的特征向量表示基础上,运用LDA模型提取用户的兴趣主题,生成用户的主题向量;在计算微博实体之间的关系强度方面,提出了一种基于内容相似性和链接相似性相结合的微博实体相似性计算方法;也提出了利用子空间学习算法来预测实体之间的关系强度的方法;在微博的社会网络挖掘方面,提出了基于可重启动的随机漫步算法(Random Walks with Restarts,RWR)的微博实体的权威性计算方法,用于信息的推荐、搜索;研究基于GN算法的微博社会网络的团体发现算法。本申请的研究成果具有重要的科学意义和应用价值,一方面,它支持多样性的社会化媒体的信息聚合、推荐和搜索等应用;另一方面,它也为新兴的计算社会学的理论研究提供重要参考。
social network;user recommendation;information diffusion;tag network;influence maximization
社会网络在人们的工作和生活中占有越来越重要的地位,正逐渐成为人们获取信息和维护社会关系的重要手段。社会网络的分析技术的研究,可以帮助人们深入认识复杂的社会网络结构,以及网络上的信息传播。本项目主要研究微博社会网络的分析技术,完成的研究内容和取得的成果包括 1)社会化标签网站的节点(人物、资源)的模型表示、关系分析。提出了基于标签网络模型的用户兴趣的描述方法;标签网络中的标签权重的计算方法;标签网络之间的相似度的计算方法。2)微博社会网络的分析技术。包括微博用户的模型表示、关系分析、网络分析。提出了微博用户相似度的计算方法;基于微博用户相似度的用户推荐方法;微博的用户相似性网络的团体挖掘方法。3)社会网络中的信息扩散预测模型。提出了一种时间相关的用户利益的计算方法;时间相关的信息扩散预测算法,对信息扩散过程中的用户行为及其发生时间进行预测。4)带符号的社会网络中的极性相关的影响力最大化问题。本项目将标准的独立级联模型扩展到带符号的社会网络上,给出了极性相关的独立级联模型;以贪心算法为基础,提出了一种极性相关的影响力最大化算法,用于发现带符号的社会网络中的具有最大影响力的一组初始种子节点。5)社会网络的网络结构对信息扩散的影响。考虑到用户推荐对网络结构和信息扩散有着重要影响,本项目提出了一种将用户推荐和信息扩散相结合的方法,使得用户推荐后的新网络可以最大化促进信息扩散。