随着互联网、电子商务和移动互联网的快速发展,能够为用户推荐有用信息,帮助他们克服信息过载的信息推荐技术变得越来越重要。传统的信息推荐技术主要通过用户对信息的评价和浏览记录来进行推荐,这种方式增加用户负担并且容易侵犯用户隐私。社会化网络应用的出现使得通过分析用户公开的社区活动进行信息推荐成为可能。本项目主要研究基于社会化网络的信息推荐技术,提出了基于标签的信息推荐方法。该方法利用标签推荐技术,用标签来统一描述用户和文档;然后以在此基础上进行的用户之间以及用户与文档间的兴趣度计算结果作为推荐依据。标签还可以使推荐依据可视化,增加用户对推荐信息的可信度。项目计划以新兴的社会化网络应用"微博"为载体来检验和评价所提出的信息推荐方法的效果。研究目标是使用户对至少80%的推荐结果感兴趣。
recommender system;text mining;deep learning;matrix factorization;link predication
社交网络在人们的工作和生活中占有越来越重要的地位,正逐渐成为人们获取信息和维护社会关系的重要手段。推荐技术可以帮助用户提高利用社交网络获取信息的效率。本项目围绕基于社会化网络的推荐方法及相关技术,完成的研究内容和取得的研究成果包括1)面向网络社区用户生成内容的文本挖掘技术,包括标签推荐、微博情感分析技术、微博文本实体链接技术、面向问答社区的问答对挖掘技术、面向论坛数据的问答对挖掘技术。提出了基于主题模型的文档标签推荐方法;基于标签传播的博文分类方法;基于贪心森林的微博实体链接技术;基于深度置信网络的答案质量评价和问题生成方法。2)基于社交网络的推荐方法研究及应用,包括基于社交网络的Top-N推荐问题研究、在线广告中的点击率预测以及蛋白质复合体检测。提出了基于社会关系的用户特征扩展方法;基于多维矩阵分解的实时竞价广告点击率预测方法和基于社区划分的蛋白质复合体检测方法。3)社交网络中链接关系预测,提出了基于分类的链接关系预测方法和基于深度学习的链接关系预测方法。4)开展了语义计算研究,针对词与短语的相似度以及句子相似度的计算方法,提出了基于不同词向量表示的相似度计算方法。