本项目利用统计物理和非线性动力学方法,针对个性化推荐系统中的核心问题-"复杂动态网络的信息自动过滤问题"展开研究。个性化推荐系统通过建立用户与产品之间的二元关系,挖掘每个用户的潜在兴趣点并在此基础上进行推荐,其本质就是信息自动过滤。本项目与以往研究的最大不同就是从理论角度研究个性化推荐系统中数据集的统计特性与推荐效果之间的关联关系,总结其统计规律,建立基于用户-产品二部分网络结构的信息自动过滤理论模型。拟提出刻画数据集静态统计特性及动态演化规律的指标量,分别基于在经典上算法上的表现和统计特性对数据集进行分类,针对不同类型的数据集,研究相应的信息自动过滤算法。进而,利用经典的热传导和物质扩散理论,设计准确度和个性化程度都很高的多步扩散算法,基于协同过滤机制可以快速处理增量数据的动态算法,以及可以追踪用户兴趣点变化的自适应算法。本项目有助于从更深层次理解和解决个性化推荐算法中的理论问题。
Information filtering;Bipartite networks;Hear conduction;Mass diffusion;
首先,本项目利用统计物理方法针对个性化推荐系统中的核心问题—“复杂动态网络的信息自动过滤问题”系统地分析了不同在线社会网络系统中的用户的行为模式,兴趣点演化,产品购买行为的统计特性。并且细致分析了用户-产品二部分网络统计特性与信息过滤算法之间的关联关系,包括热传导和物质扩散过程对用户相似性度量的影响,二部分网络的边权与算法表现的关系,考虑偏差的高效热传导算法,以及物质扩散的有向相似性对于信息过滤的影响等问题。本项目与以往研究的最大不同就是从理论角度研究个性化推荐系统中数据集的统计特性与推荐效果之间的关联关系,总结其统计规律,建立基于用户-产品二部分网络结构的信息自动过滤理论模型。依据用户的兴趣点演化和行为模式,提出了刻画数据集静态统计特性及动态演化规律的指标量。进而,利用经典的热传导和物质扩散理论,设计了准确度和推荐列表多样性都非常好的信息自动过滤算法,以及可以追踪用户兴趣点变化的自适应算法。本项目有助于从更深层次理解和解决个性化推荐算法中的理论问题。第二,人才培养。依靠本项目,总共培养青年教师7名,博士研究生2名,硕士研究生11名和8名本科生。项目负责人刘建国在上海理工大学通过学术擂台被评为教授,特聘博士生导师,并被评选为2011年上海市科技启明星(A类)。刘建国被牛津大学Said商学院聘为Research Fellow,同时受到欧盟第七框架基金和索罗斯基金资助,成为牛津大学James Martin School的Fellowship。项目组成员申请国家自然科学基金两项,两位青年教师被评为副教授。第三,成果体现。总共发表论文22篇,其中SCI收录15篇,EI收录7篇。SCI总引用次数超过150次,其中《Solving the apparent diversity-accuracy dilemma of recommender systems》在美国科学院院刊发表后,《Nature》对该文进行了专题报道。该文目前已经被SCI引用45次,被引用次数为当期论文的前5%。撰写专著一本,撰写“十二五”规划重点教材一本,总共62.5万字。第四,学术活动。受邀参加第四届中欧复杂性科学暑期班做大会报告,并主持青年科学家论坛。2011年组织了上海复杂系统科学研究论坛和中欧三亚复杂性科学研究路线图会议,2012年作为特邀嘉宾参加。