论文部分内容阅读
高速发展的网络科技推动了信息与数据的大量生产,但同时也造成了信息过载问题,个性化推荐系统较好地缓解了这一现象,现已应用在众多网络平台。同时,随着社交网络的兴起,社会化推荐也成为热点研究,它能够利用社交关系信息缓解推荐算法中的稀疏性和冷启动问题。然而由于主流的推荐算法依赖用户的历史行为数据,虚假用户趁机利用这一特性向推荐系统注入虚假评分信息、社交关系等,改变正常的推荐结果从而达到牟利的目的。这种行为不仅改变推荐结果、降低用户满意度,并且严重影响了公平有序的线上环境。因此如何检测出这些恶意的虚假用户,净化推荐环境是一个重要的研究内容。这一问题已经得到研究者的广泛关注,虽然目前已有一些成熟的方法检测虚假用户,但是随着虚假用户攻击模型的不断升级,例如虚假用户借助社交关系提高攻击能力,传统的针对评分攻击的虚假用户检测的方法无法较好地检测出这种社会化攻击。为了探究应对社会化攻击的虚假用户检测方法并提高检测性能,本文首先提出了多种融合关系和评分的混合攻击模型,通过该模型向推荐系统数据集注入虚假用户来模拟真实场景中的虚假用户;并提出了适用于应对社会化攻击的虚假用户检测算法,该方法通过结挖掘社交关系中的特征与评分特征协同训练分类器以提高检测算法的鲁棒性。本文的主要工作总结如下:(1)介绍了推荐系统的发展趋势、阐述了虚假用户攻击模型、分类阐述了虚假用户检测方法,并分析提出了经典攻击模型的不足和虚假用户检测模型的瓶颈。(2)构建了融合用户关系的混合攻击方法,包括3种基本的用户攻击方法。将这3种攻击方法分别和经典的评分攻击两两结合,即可构成12种混合攻击,这种攻击模式对社会化推荐会产生尤为巨大的负面影响。(3)构建异构信息网络,设计多条元路径挖掘网络中潜在的特征,从而提出能够应对融合社交关系的新型攻击的虚假用户检测方法。(4)在多个数据集上对本文提出的方法进行大量的实验,验证了本文所提出方法的有效性。(5)设计实现了包含虚假用户检测功能的推荐原型系统。该系统实现了协同过滤和社会化推荐算法、本文提出的融合用户关系的混合攻击以及基于异构信息网络与矩阵分解的虚假用户检测方法。