论文部分内容阅读
作为电子商务推荐系统中使用最为广泛的技术,协同过滤推荐技术通过将日常生活中的“口碑效应”应用到自动推荐流程,为系统用户提供个性化、高质量的推荐服务,并在实际应用中被证明是电子商务系统信息超载问题的有效解决方案。
随着系统应用范围的不断扩展,在商业利益的驱动下,为提升某些商品被推荐频率,商业竞争者开始频繁地在推荐系统中注入虚假评分记录,试图人为影响目标商品的推荐频率,扭曲推荐准确性与公正性,从而撷取商业利润。而由于协同推荐系统具有天然的开放性,攻击者在掌握少量系统信息的前提下,即可成功对协同推荐系统推荐结果产生影响。这种行为影响了系统的准确性和公正性,因而引起了学界的注意。
本文首先阐述协同推荐基本原理和主流协同过滤推荐算法的算法流程,在此基础上,论文介绍现有协同过滤攻击的研究成果,重点阐述攻击模型的形式化定义,提升性攻击模型的4种主要模式及组成结构,以及攻击模型对协同推荐算法所产生的影响。在此基础上,论文针对攻击模型的组成结构,结合推荐系统用户-项目评分矩阵的一般特性,提出基于语义聚类的协同推荐攻击检测方案,通过一系列的实验验证,基于语义聚类的攻击检测方案具有良好的鲁棒性和普适性,检测准确率对比现有的数理分析方法也有明显的提升。针对攻击行为日益人工化的趋势,论文还提出基于最近邻过滤的协同推荐攻击防御方案,以有效屏蔽具有较高模仿度的伪造记录。最后,论文介绍协同推荐攻击检测原型系统的设计与实现方式,以有效整合两种攻击检测方案,构建更为健壮的协同过滤推荐系统。