随着社会化网络社区中资源的大量增加,越来越多的网上社区采用推荐技术来方便用户获取信息。而传统推荐算法在用户兴趣信息缺失或较少的情况下很难给出准确的推荐结果,这被称为冷启动问题或稀疏问题。跨域推荐是缓解该难题的有效途径,即利用用户在其它服务或社区中的信息来优化目标服务的推荐准确度。本项目旨在利用丰富的社会媒体及多渠道网络信息,实现不同服务或社区中用户的自动识别和对应,定义和计算属于不同类别或媒体资源的相关性,进而跨域迁移用户兴趣,预测用户在目标服务中的兴趣,最终实现社会化网络社区中的跨域推荐以缓解传统推荐算法面临的冷启动或稀疏问题,同时寻求跨域推荐的合理解释,方便用户获取和选择信息。本项目将研究多种跨域推荐算法,搭建原型并力求在实际系统中应用推广。
Social network;Cross-domain recommendation;Personalized recommendation;Information diffusion;
随着社交网络的蓬勃发展,越来越多用户参与其中并不断提供自己的资源与他人分享,因此社会化网络社区中的资源总量也在不断膨胀。这些海量的信息资源虽然为用户带来了大量的便利,却也使他们难以准确定位到自己需要的内容。本项目按照计划书所列研究内容顺利开展研究工作,主要围绕如何利用社会化网络社区中的多源信息,研究不同类型、来源的数据处理手段与高速计算方法,并研究实际应用场景中用户的需求体验,进而为用户提供更优质的信息推荐服务。基于项目研究成果研发了适用于盲人的信息检索与推荐系统,应用于“中国盲人数字图书馆”中,已为来自全球116个国家的300多万人提供了服务,用户总点击数超亿次。项目共发表论文20篇,其中SCI期刊论文12篇(11篇2015年影响因子大于2),顶级国际会议论文8篇,申请发明专利7项,超过项目计划书要求。在社交网络个性化推荐、跨域推荐、社交媒体数据表征与高性能语义处理等领域取得了一系列成果,包括(1)针对推荐系统中普遍存在的数据稀疏问题,提出一种基于用户-资源兴趣子集的协同过滤方法,在数据稀疏时仍有较好的推荐效果。(2)针对社交网络“小圈子”现象阻碍信息广泛传播的问题,提出一系列推荐算法,突破用户信息传播的局部区域限制,实现跨区域的有效信息传播。(3)社交化网络社区中的数据往往来源迥异且种类繁多,跨域数据理解及潜在信息挖掘一直是业界研究热点。研究团队从多个实际问题入手,如新闻图片人脸——名字对应、多渠道用户信息挖掘、社交网络潜在关系挖掘等,研究各个应用场景中合适的社交网络挖据算法。(4)针对社交化网络社区中数据量巨大且维度较高的问题,提出利用流形学习方式将数据纬度进行合理化压缩,并利用图排序方法大大提高在海量数据集上的计算效率。