基于时间序列的跨站点虚假评论检测研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:zhouli1017
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务的发展,越来越多的消费者开始选择网购。消费者通常会在做出购买决策前参考已购用户对该商品的评价。人们对于商品评论的依赖导致了虚假评论的涌现,部分商家受利益驱使,开始雇人过度褒奖己方商品或者恶意诋毁竞争对手商品。虚假评论不仅会影响消费者的网购体验,还会使部分商家的名誉受损。虚假评论检测作为观点挖掘、情感分析和推荐系统的预处理技术,近年来成为了一个研究热点,其在学术研究和实际应用中均有深远意义。虚假评论检测领域的现有研究大多数是采用机器学习方法将虚假评论检测转化为分类问题来处理,研究对象主要集中在评论文本特征、评论者行为特征和商品特征上。这类方法依赖于繁重的特征工程,在真实数据集上获得的性能也有限。近年来,基于时间序列的虚假评论检测开始出现,且取得了不错的性能,此外,现有研究大多数都是面向单站点、单语料的。因此,本文考虑运用基于时间序列的跨站点、跨语料虚假评论检测方法来展开研究,主要内容如下:首先,本文对虚假评论检测的发展现状做了系统地综述,以虚假评论检测对象的变化为线索,总结了该领域所用到的特征和算法,以及这些方法的优缺点。接着汇总了本领域的常用数据集,为后续研究中实验数据集的选取打下基础。结合以往的研究成果和盲区,本文提出了跨站点、跨语料的全新检测思路来解决虚假评论团伙在单一站点中的伪装欺诈。然后,在对时间序列、跨站点检测和评论图模型的相关技术进行介绍后,提出了基于时间序列的跨站点、跨语料虚假评论检测模型。首先在中文、英文网站上构造同一商品的评论时间序列并完成预处理,然后分别在单条时间序列和跨站点时间序列上进行突发评论检测并将时间序列特征以嫌疑时间段的形式展现出来,最后融合评论文本特征后作为模型的总体输入特征。实验结果表明,该模型的效果在传统的基于评论文本内部特征的检测算法上提高了14%。最后,由于融入评论外部特征对虚假评论检测性能提升有关键影响,受评论图模型启发,本文通过寻找评论、评论者、商铺这三者可信度的相互影响关系,将三者抽象为关系图,从而构建了改进后的评论、评论者、商铺可信度的评分模型。实验结果表明,本文模型对虚假评论的检测性能相比传统评论图模型算法性能提升了1.1%。
其他文献
研制一种以SrTiO3-Bi2O3.CaTiO3为主晶相的V组线性电容器瓷料,以三、五族氧化物为改性剂,使容量温度特性一化;加PbTiO3,使介电常数提高,其介电常数ε〉310,电容温度系数αc=(-1500±250)×10^-6/C,其余各项电气、物理、机械性
作为我国生态文明制度创新的一项重要内容,自然资源资产负债表是衡量自然资源资产运行机制是否完善、监管是否到位、管理是否高效的主要依据,也是国土资源管理不可或缺的工具
对铝在磷酸溶液中的恒压阳极氧化过程进行了研究,结果表明随着电解电压的升高,形成了氧化铝多孔膜的阻挡层增厚,多孔层的孔径和胞径均增加,其原因与离子迁移等密切相关。
通过体外试验确定肿瘤细胞对化疗药物的敏感和耐受情况,从而有针对性地选择有效化疗药物,提高肿瘤治疗效果,减轻因应用药物可能带来的副作用,这一直是肿瘤研究中的重要领域之
概括了中原地区地名的命名方式,阐述了加强地名文化建设的重要意义,分析了中原新型城镇化建设中地名命名存在的问题,提出了加强地名文化建设的措施。
评述了铝熔体泡沫化制备胞状铝的工艺过程及其发展历史,讨论了胞状结构参数的定量描述及多功能性能,前瞻了该材料的应用前景,分析了现存问题及发展趋势。
本文以《铸造》杂志50年来发表的文章为线索,描述了我国铸造业50年的发展历程和取得的成就,并提出了今后发展方向.
随着科学技术的飞速发展,我国的采煤技术也在不断地发展和更新。虽然近年来我国的采煤技术得到了质的提升,但是跟国外相比,还存在着巨大的差距,这些差距主要表现在采煤机的锻造工
文章对程阳八寨景区发展现状进行调查分析,发现程阳八寨景区民俗文化资源的旅游开发过程中,仍存在着一些问题,如不当开发造成资源破坏,旅游产品单一无法满足旅游者需求等。因