基于缺失评分填充的恶意用户检测算法研究

被引量 : 0次 | 上传用户:sxsj002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务的迅速发展,电商平台已成为人们购物的主要渠道之一。对于商品与服务的信任度在电子商务平台的成功运营中起着举足轻重的作用,商品评价则已成为影响消费者购买决策的关键参考因素。因此,互联网商家会采用各种手段来提高自己的销售额和信誉度,雇佣水军就是其中一个常用手段。商家雇佣这些水军发布虚假评价以干扰用户对商品真实质量的判断,从而影响消费者的购买决策,以达到提高商品销量的目的,这不仅会降低消费者的购物体验,甚至会破坏公平的市场秩序。近年来水军的存在对商品评价系统的可靠性造成的危害日益严重。为了解决这个问题,研究人员提出了各种方法来检测水军,常见的一类方法是分析用户评分规律。学者们利用用户的评分信息构建评分网络,然后基于特定的假设来计算各个用户的信誉值,并将信誉值较低的用户视为恶意用户。然而,这类方法在稀疏数据集下的准确率有待提高,为此有必要提高稀疏数据下水军检测的准确率。为了改善稀疏数据下水军检测的效果,本文提出了一个识别恶意用户的通用框架,即填充低度用户的缺失评分以增加其对商品评价系统的贡献,从而提高当前水军检测算法的准确率。使用本框架检测水军的一般流程为:首先预测低度用户的缺失评分,然后将其扩展到现有的数据集中,接下来将扩展后的数据集应用到现有的水军检测算法上来识别水军。作为框架中预测低度用户缺失的评分值的方法,本文在第三章的实验中基于用户行为特征的相似性来预测缺失评分,紧接着在第四章的实验中分别使用受限玻尔兹曼机和深度置信网络来进行更准确的预测。在预测了各低度用户的缺失评分后,最后分别将各方法预测后的评分扩展到现有数据集上与水军检测算法相结合来识别水军。实验结果表明,填充低度用户的缺失评分可以有效提高基于信誉值识别恶意用户的水军检测算法的准确性质和鲁棒性。本文的主要贡献在于针对稀疏数据下恶意用户检测问题,提出了一个通过填充低度用户评分信息缓解数据集稀疏性以识别恶意用户的一般框架。本文提出的方法可以有效地降低误检率,并在不同类型的社交网络中展现出良好的鲁棒性。此外,在使用本文的框架缓解数据稀疏后,可以与除文中使用的其他基于信誉值的水军检测算法结合来识别恶意用户,具有较高的通用性。
其他文献
学位
学位
学位
聚类以无监督学习方式将无标签数据分为不同类簇,是当前数据挖掘的重要手段之一。其中,网格聚类以网格单元为处理单位,聚类时间复杂度独立于数据点的数目,在大数据集聚类方面备受青睐。然而,随着数据量的增大和数据维度的增加,网格聚类会因非空网格数量急剧增加而致聚类效率降低;此外,由于现实中的数据往往存在类簇间的交叉重叠,传统网格聚类算法使用连通性进行聚类容易将多个交叉类簇错误地聚为同一类簇,致使聚类精度降低
学位
学位
网络化控制系统作为工业领域中重要的基础设施,已深入到经济、文化、政治和社会等各个领域。在加快社会发展进程的同时,也极大提高了人类的生活和工作质量。随着网络技术的飞速发展,网络化系统结构愈发复杂多变,其应用领域也在发生着翻天覆地的变化。在网络化系统中,其数据的有效传输常常依赖于网络中的有限带宽,但是在系统趋于稳定的过程中,其传输的数据有一部分具有较高的相似性。因此,为了减少这种不必要的相似数据传输,
学位
学位
学位
虚假评论检测技术是指可以从评论数据中自动区分真实评论和虚假评论的技术。随着电子商务的快速发展,人们从线下购物逐渐转变为线上购物,并在一些社交平台分享他们对产品和服务的看法或评论。然而,一些不法商家为了利润雇佣水军在社交平台上进行欺诈评论以此来误导消费者。这种问题不仅会给消费者带来损失,还会影响电子商务平台的良性发展。尽管研究工作者已经提出大量虚假评论检测方法,但仍存在一些问题亟待解决。包括(1)现
学位
随着推荐系统在互联网应用中得到了广泛的关注,越来越多的学者尝试在更多的领域探索与单类协同过滤推荐算法有效结合的方法。近年来,文献服务和学术交流等领域的推荐服务逐渐引起关注,如文献资源推荐、学者推荐、主题词推荐等。从学者行为角度进行文献主题词推荐服务的数据偏差研究也成为一个研究点。数据偏差问题会对面向学者和文献的主题词推荐服务带来很多不利影响,如选择偏差会使学者在文献中只对海量主题词中的极少部分作出
学位