论文部分内容阅读
随着电子商务的迅速发展,电商平台已成为人们购物的主要渠道之一。对于商品与服务的信任度在电子商务平台的成功运营中起着举足轻重的作用,商品评价则已成为影响消费者购买决策的关键参考因素。因此,互联网商家会采用各种手段来提高自己的销售额和信誉度,雇佣水军就是其中一个常用手段。商家雇佣这些水军发布虚假评价以干扰用户对商品真实质量的判断,从而影响消费者的购买决策,以达到提高商品销量的目的,这不仅会降低消费者的购物体验,甚至会破坏公平的市场秩序。近年来水军的存在对商品评价系统的可靠性造成的危害日益严重。为了解决这个问题,研究人员提出了各种方法来检测水军,常见的一类方法是分析用户评分规律。学者们利用用户的评分信息构建评分网络,然后基于特定的假设来计算各个用户的信誉值,并将信誉值较低的用户视为恶意用户。然而,这类方法在稀疏数据集下的准确率有待提高,为此有必要提高稀疏数据下水军检测的准确率。为了改善稀疏数据下水军检测的效果,本文提出了一个识别恶意用户的通用框架,即填充低度用户的缺失评分以增加其对商品评价系统的贡献,从而提高当前水军检测算法的准确率。使用本框架检测水军的一般流程为:首先预测低度用户的缺失评分,然后将其扩展到现有的数据集中,接下来将扩展后的数据集应用到现有的水军检测算法上来识别水军。作为框架中预测低度用户缺失的评分值的方法,本文在第三章的实验中基于用户行为特征的相似性来预测缺失评分,紧接着在第四章的实验中分别使用受限玻尔兹曼机和深度置信网络来进行更准确的预测。在预测了各低度用户的缺失评分后,最后分别将各方法预测后的评分扩展到现有数据集上与水军检测算法相结合来识别水军。实验结果表明,填充低度用户的缺失评分可以有效提高基于信誉值识别恶意用户的水军检测算法的准确性质和鲁棒性。本文的主要贡献在于针对稀疏数据下恶意用户检测问题,提出了一个通过填充低度用户评分信息缓解数据集稀疏性以识别恶意用户的一般框架。本文提出的方法可以有效地降低误检率,并在不同类型的社交网络中展现出良好的鲁棒性。此外,在使用本文的框架缓解数据稀疏后,可以与除文中使用的其他基于信誉值的水军检测算法结合来识别恶意用户,具有较高的通用性。