为避免电子商务中商品被系统推荐过程中的虚假欺骗信息、确保商品推荐排名真实性,针对协同过滤推荐技术,探索利用攻击检测和用户可信度,结合攻击群体性和攻击者行为模式等,开展抗托攻击的协同过滤推荐机理的研究。在对协同过滤推荐中攻击群体概貌的结构特性、项目异常检测和用户可信初始化策略等方面进行深入研究的基础上,着重就项目异常检测、基于聚类的攻击群体检测、可信值奖惩策略和可信值在用户关系网络中的传播机制等方面进行研究,最终形成基于用户可信度的协同过滤推荐算法;拟采用国际标准测试数据集和实际数据集验证模型和算法的正确性和有效性。在理论方面,本研究可促进人们对面向特定领域的群体攻击检测及可信计算模型做深入探讨;在应用方面,为协同过滤推荐技术中托攻击问题的解决开拓新颖研究思路,有望获得创新性和实用性并举的成果,从而为电子商务中商品个性化推荐提供安全保障,商业前景广阔。
Collaborative filtering;Personlized recommendation;Shilling attack;Attack detection;Trust model
电子商务零售业的迅猛发展使个性化推荐显示出重要地位,目前广泛应用的协同过滤推荐有着评分驱动的特性,使得其容易受到托攻击(虚假用户攻击)。课题组从分析协同过滤推荐中攻击群体概貌的量化特征入手,研究群体攻击的检测机制及用户可信度的计算模型,并将两者整合到协同过滤方法中,以提高推荐系统的抗托攻击能力。 已按照申报书计划完成三部分研究(1)基于项目异常检测和聚类的群体攻击检测机理研究根据异常项目呈现两个特性目标项目评最高或最低分、异常项目在一定时间区间内评分分布会发生异常,提出比较项目某时间区间的评分分布与其余评分分布找到可疑区间;由于固定时间窗口划分常因项目评分次数不均衡而难以检测异常,提出依据重要点对项目评分时间序列动态划分的方法;最后通过基于卡方分布的自顶向上离散化方法进行不同区间上的项目评分相似度度量,标识异常区间完成对异常项目的检测,准确率可以达到80%。将此项目异常检测与传统的采用聚类算法的虚假用户检测方法结合,可以提高虚假用户检测的准确性,准确率在多数情况下可以达到99.99%。(2)面向抗攻击推荐的用户可信度计算模型研究推荐系统中用户具有不同的可信度,如果从可信度角度考虑用户的重要性,可以通过对虚假用户赋予较低可信度,降低其评分权重。在分析现有可信度模型的基础上,提出基于项目评分均偏差的可信度计算方法;然后借鉴P2P网络中信任度的计算方式,得到直接信任计算模型;最后讨论了信任度在信任网络中的传播机制,提出基于时间因子和路径中信任强度的信任传播机制。(3)抗托攻击的协同过滤推荐方法研究首先使用信任度代替传统相关性作为权值,提出基于用户间信任度的推荐算法;然后分析虚假用户概貌中项目流行度均值和方差与正常用户之间的差异,提出两者加权的指标进行虚假用户检测和协同过滤推荐,以提高推荐系统的抗托攻击性能,评分预测偏移量和命中率偏移量降低至0.1及0.01以内。 课题组在成果方面,获得省部级科技进步奖二等奖1项,在学术期刊和国际会议上发表论文14篇,其中SCI 7篇、EI 10篇、CSCD核心期刊3篇,培养博士后2人,博士生6人,硕士生8人。在理论方面,对面向特定领域的群体攻击检测及可信计算模型做了深入的探讨;在应用方面,为推荐系统中托攻击问题的解决开拓了新的研究思路,为商品个性化推荐提供安全保障。