基于主题模型的虚假评论人群组检测方法

来源 :沈阳理工大学 | 被引量 : 2次 | 上传用户:guoyurun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅猛发展,电子商务也得到了井喷式发展。在网上购物时,大多数的消费者在决定购买某一产品前都会事先去阅读该产品的评论信息,因此产品评论对于消费者购买决策方面有着指导作用。但是有很多个人或组织为了利润和名誉,通过雇佣一些“网络水军”去书写一些虚假评论或给一些不公正的打分来推销或诋毁目标产品。虽然在这个领域已经有很多人付出了努力,但是要收集到真实标注数据集难度非常大,因此这个问题至今还未得到解决。检测虚假评论人群组已经成为当今观点作弊检测的主要形式。本文提出了一种基于LDA的计算框架(称为GSLDA)用于在评论数据集中检测虚假评论人群组。GSLDA有三个阶段。第一阶段,使LDA适应于产品评论环境中,把作弊群组中的评论人聚到某一个评论人聚簇中。第二阶段,寻找每个聚簇中异常的评论人,生成评论人图并利用SCAN提取出高度可疑的评论人群组。第三阶段,通过群组的特征计算,对候选作弊群组进行降序排序,以找到真正的作弊群组。通过在三个真实数据集上的实验,证明了GSLDA方法的有效性。它的精确度与召回率都超过了多个解决同类问题现有最有效的方法,如FraudEagle、SPEagle、GSBP和GSBC等。
其他文献
从Egocentric视频摘要中检测和识别不同的对象是计算机视觉的一项重要技能,它利用在图像和数字视频中对特定语义类的检测实例来进行动物识别,并生成一段简短而有意义的视频,
为使得DP曲线具有形状调节的功能,提出带2个形状参数的三次DP曲线。首先将一类三次DP基函数进行了推广,给出带2个形状参数的广义三次DP基函数;然后基于该基函数定义带形状参
SCBA全国体育院校篮球联赛的前身是全国体育学院篮球锦标赛,于2016年由过去的四年一届改革为现在的一年一届。全国体育院校篮球联赛的改革,促进了体育院校篮球人才的培养,不
为了标准化实验室内半刚性基层试件的压实过程,使其在实验室内就能模拟现场振动压路机的真实碾压工况,本文设计一种新的振动压实成型机。目前,市场上振动成型机种类复杂,参照
随着移动互联网的飞速发展和无线网络的不断普及,手机已经成为人们生活中的一部分。目前手机系统以IOS和Android为主,其中Android系统因其开源、开发方便、免费等特性深受广
近年来,随着我国高速公路建设规模的扩大,公路隧道数量急剧增长。受地形及占地等因素的影响,连拱隧道的建设越来越受到人们的重视。早期修建的连拱隧道大多以整体式中墙连拱隧道为主,随着运营时间的延长,整体式中墙连拱隧道暴露出严重的病害问题。随后,复合式中墙连拱隧道逐步被应用到连拱隧道的设计与施工中。相比于整体式中墙连拱隧道,复合式中墙连拱隧道运营过程中的工作状态整体表现相对较好。由于该隧道形式出现的时间相
厌氧氨氧化(anaerobic ammonium oxidation,简称ANAMMOX)生物脱氮工艺因其具有节约氧耗、污泥产量低、基质去除速率高等显著优点,使其成为了国内外学者的研究热点。但活性污
21世纪以来,我国国民经济飞速发展,大宗货物运输量的急剧增加,对铁路货运能力提出了越来越高的要求。因此,开展重载铁路运输成为了现今铁路货运发展的必然道路。在开展铁路重载运输的过程中,出现了许多问题,货车运行平稳性就是其中非常重要的一个课题。运行平稳性主要包括横向平稳性、垂向平稳性。本文主要以纵向力作用对重载车辆运行平稳性的影响为研究对象开展相关工作。本论文对某重载线路实测纵向车钩力实验数据进行收集
聚类分析是数据挖掘领域最重要的研究分支之一,也是数据挖掘领域最为常见和最有潜力的发展方向之一,它的目的是根据某种相似度度量对数据集进行划分。目前,针对数值数据的聚
本文旨在全面深入的了解我国高校大规模开放在线课程的发展现状和体育院系理论课程的MOOC开展情况的基础上,进一步探究体育院系理论课程MOOC课程监控的现状,并构建适用于体育