本项目主要研究一种融合多元因素的动态协作过滤算法,并在已有的知识服务环境上进行验证,主要内容包括(1)针对协作过滤考虑因素单一、无法全面刻画用户个性的问题,提出一种融合兴趣、性格、知识背景等因素的多模个性特征及其可计算表示;(2)针对静态协作过滤时效性差、动态性不足等问题,研究一种支持自适应更新的动态协作过滤,实现对用户兴趣的动态跟踪和实时推荐;(3)提出了不同于BP迭代学习的一次成型算法投影向量机,克服BP耗时、局部极值的不足,解决了ELM在高维小样本下性能下降的问题;(4)与Kernel方法相结合,从增量学习、减量学习、变维学习等多个角度对投影向量机进行研究,解决了投影向量机的在线学习问题。发表高水平SCI/EI论文8篇;申请专利2项;协作过滤原型系统一套;培养硕士研究生2~4名。
Collaborative filtering;Interest and Sence Detection;Personalized recommendation;Neural network;Kernel method
本课题主要创新工作总结为第一,针对协作过滤中高维稀疏数据的模型训练问题提出具有快速学习能力的PVM极速神经网络算法。打破传统的神经网络学习方法中梯度下降和误差反向传播的思路,学习一次完成,无需迭代,实验表明算法具有快速的学习能力和具有良好的泛化性能。第二,针对协作过滤模型动态更新问题提出PVM的三种更新算法。以增量学习理论为指导,提出PVM三种更新算法分别解决据模型的增量更新、减量更新和变维更新问题。与其他算法相比,算法具有很快的学习速度。第三,进一步结合核方法数据挖掘框架,提出核化投影极速神经网络KPVM。针对传统二阶段学习中降维冗余、不易在线更新的问题,提出一阶段学习算法PVM及其扩展KPVM,KPVM不但具有快速的学习速度和良好的泛化性能,同时不产生中间数据,易于在线更新。实验表明KPVM在高维小样本情况下的泛化性能显著优于其他神经网络。这些更新算法支持chunk-by-chunk和one-by-one两种模式,继承了KPVM在高维数据下的优点,具有良好的泛化性能。最后,结合部分理论研究成果,设计与开发了基于动态协作过滤的教育资源推荐系统,应用在海量教育资源管理系统(Yotta)中,实现对文本、网页、多媒体等多种类型资源的推荐。在287门课程,2.4TB多媒体资源数据规模下,分类精度可达68%,查准率可达63%,比BP+SVD、SVM+SVD、Fast-SVD等代表性的协作过滤算法的精度有了明显提高。