位置:成果数据库 > 期刊 > 期刊详情页
基于Spark的分布式并行推理算法
  • ISSN号:1003-3254
  • 期刊名称:《计算机系统应用》
  • 时间:0
  • 分类:TP311.13[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]福州大学数学与计算机科学学院,福州350108
  • 相关基金:国家自然科学基金(61300104)
中文摘要:

协同过滤推荐算法分为基于内存和基于模型的推荐算法,协同过滤推荐算法存在数据稀疏性、可扩展性、冷启动等问题.通过基于用户、基于项目协同过滤推荐算法以及SVD、Slope-One、KNN等基于模型协同过滤推荐算法对比分析.提出加入特征向量维度优化的SVD算法,通过降维改善数据稀疏性问题.利用Hadoop分布式平台改善推荐算法可扩展性问题.基于Movie Lens数据集实验结果表明,引入基于Boolean相似性计算方法的推荐效果更优,引入数量权重和标准差权重的优化Slope-One算法和引入特征向量维度的优化SVD算法推荐效果更优.

英文摘要:

The collaborative filtering recommendation algorithm is divided into user-based and item-based recommendation algorithms. Collaborative filtering recommendation algorithm had data-sparseness and scalability and cold-start problems. This paper mainly studied the collaborative filtering recommendation algorithm based on the users or Items and SVD, Slope-One, KNN. The optimization of SVD algorithm which considers the dimension of the feature space used dimension reduction to improve data-sparseness problem. Using the Hadoop distribution platform to improve the scalability problem. Experimental result shows that the similarity computation method based on Boolean data has better result and the optimization of Slope-One and SVD algorithm have better recommendation result based on MovieLens data set.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机系统应用》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院软件研究所
  • 主编:苏振泽
  • 地址:北京8718信箱
  • 邮编:100190
  • 邮箱:csa@iscas.ac.cn
  • 电话:010-62661041
  • 国际标准刊号:ISSN:1003-3254
  • 国内统一刊号:ISSN:11-2854/TP
  • 邮发代号:82-558
  • 获奖情况:
  • 国内外数据库收录:
  • 波兰哥白尼索引,美国剑桥科学文摘,中国中国科技核心期刊,中国北大核心期刊(2000版)
  • 被引量:15201