【摘 要】
:
—随着互联网的发展,在线消费形式的电子商务平台已成为人们现在最流行的消费方式。电商平台一般都允许和鼓励用户在消费后对产品或者服务进行评论,而且用户评论对潜在的消费
论文部分内容阅读
—随着互联网的发展,在线消费形式的电子商务平台已成为人们现在最流行的消费方式。电商平台一般都允许和鼓励用户在消费后对产品或者服务进行评论,而且用户评论对潜在的消费者和商家都具有很高的价值。然而在利益的驱使下,垃圾评论用户通过发布虚假的评论来推广或者诋毁目标产品进而来误导消费者。因此检测垃圾评论对消费者和商家都有重要的意义。垃圾评论识别领域的研究可分为垃圾评论检测、垃圾评论用户检测和垃圾评论用户群组检测。目前研究主要集中于垃圾评论或用户的识别,而对群组检测的关注较少。在刚开始的研究中经常使用评论文本的语言特征和评论用户的行为来检测垃圾评论或者用户。不过现在由于垃圾评论过滤系统的存在,提高了垃圾评论的门槛,垃圾评论用户可以通过操控自己的行为与评论文本内容来假装为一个真实的评论用户,因此导致只通过评论文本或用户行为检测垃圾评论或者用户越加困难。而且相比于单个评论或用户而言,一个垃圾评论用户群组(一组评论用户相互合作对共同目标编写虚假评论)更具有破坏性,因为他们的人数很多,可以更多甚至完全控制目标产品的评价情感,所以研究垃圾评论用户群组的识别变得越加重要。本文发现,在由评论用户群组、评论用户和产品组成的网络结构中,通过实体(群组、用户和产品都称为实体)间的相互关系,可以在评论体系网络中传递垃圾信息。这种传递方式与网页节点在Web页面组成的网络结构中可以通过链接关系来传播权威值很类似。因此本文提出了基于Web页面权威值排名的经典算法PageRank上的GroupRank算法。在计算群组的垃圾信息时,GroupRank不仅考虑了各个节点的基础垃圾信息,还考虑了从其他节点通过网络传递给群组的垃圾信息,并用它们之间的垃圾影响力(实体间的关系程度)对其加权,最后使用调节因子调整群组基础垃圾信息和垃圾影响的占比。本文设计了排序和分类两种实验来验证GroupRank对群组垃圾评论识别的准确性,对比了其它的垃圾评论群组检测的算法。实验结果证明,GroupRank算法可以有效地识别垃圾评论用户群组,而且识别效果优于传统的排名算法和分类算法。
其他文献
背景 学术期刊的跨学科评价,是国内外研究的热点和难点。目前,学术期刊跨学科评价指标主要有期刊分区(journal Quarti,JIF Quarti)、期刊影响因子百分位(journal impact fact
计算机视觉理论出现于二十世纪五十年代,主要用于二维图像的分析与识别。计算机视觉研究的出发点及核心均在于提取视觉信息,而对视觉信息的合理处理就是解决一切问题关键。本
受人类活动和气候变化影响,我国海岸带盐沼植被面临着严重威胁,其面积、分布以及相应的生态服务功能处于快速变化中。如何快速准确地对海岸带盐沼植被进行精准遥感监测,对维
在神经科学研究领域,通过电极阵列同时记录多个神经元放电活动越来越普遍。分析多个神经元的连接关系是了解产生某种特定脑功能活动神经元如何工作的关键。论文通过记录猴子
行人检测在视频监控、人机交互、无人驾驶、机器人、高级驾驶员辅助系统等方面有着广泛应用。在计算机视觉领域,研究最多的就是行人检测。准确率高、速度快是研究人员追求的
近年来,随着互联网的发展,数据呈爆炸式增长。为了挖掘数据中的价值,大数据处理技术已经成为计算机领域中不可或缺的重要手段,Google提出的MapReduce计算模型成为大数据时代
B3∑u-态是 O2的最强的三重跃迁(B3∑u-←X3∑g-)Schumann-Runge(SR)带的上态,SR吸收带在保护地球、阻止紫外辐射等方面起着关键作用。SR连续带的光解离是平流层O原子及O3的
在经济建设发展过程中,新型城镇化应运而生,实现社会发展的同时,也提高了人们的生活质量。然而随着新型城镇化的不断发展,环境问题给人们的生产生活带来了极大威胁,特别是雾霾污染持续加剧。因此,为了保证经济和环境的可持续发展,必须对雾霾污染采取防治措施。城镇化对PM2.5的影响有所不同,首先,受地理条件限制,新型城镇化对PM2.5的影响具有区域差异性;其次,根据时间演变规律以及空间地理距离衰减性,新型城镇
单纯使用广义相对论而不引入暗物质暗能量的情况下,无法解释很多观测现象,比如星系自转曲线问题,宇宙膨胀问题。但是暗物质的所有探寻实验都无法给出明确结果,暗能量的本质更
随着移动通信的快速发展,无线传输的速率越来越快,为移动智能终端和云计算的发展奠定了基础。移动智能终端越来越深入人们生活的各个场景,承载的功能越来越多,但是由于终端自