基于深度学习的虚假评论检测研究与实现

来源 :郑州大学 | 被引量 : 0次 | 上传用户:aurogon1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电商平台中真实可信的用户评论可以帮助消费者做出正确的消费决策。然而,受不同动因驱使,电商平台中也充斥着大量虚假评论。虚假评论不仅会误导用户的消费决策,同时也会对商家及电商平台造成消极的影响。在此背景下,虚假评论的检测与治理对监督网站运营、净化网络环境具有重要的意义。本文基于深度学习技术对虚假评论检测方法展开研究。为实现对虚假评论的准确、高效检测,从评论间相似性与评论文本情感两种角度出发,提出两种虚假评论检测方法。在此基础上,利用上述两种方法中提取的蕴含评论间相似性和评论情感强度的特征,提出了一种基于多线索的虚假评论检测方法,并设计实现了一个可对评论进行自动采集及虚假评论检测的系统。主要内容如下:(1)提出一种基于图卷积网络的虚假评论检测方法。虚假评论间通常会有高度相似的内容,但是现有的基于深度学习的虚假评论检测方法,通常对每条评论单独提取文本特征而未充分考虑评论间的相似性。本文利用不同评论中词汇的语义相似性间接衡量评论间相似性,并基于图卷积网络进行虚假评论检测。首先,基于词汇语义相似性构建评论文本图,将虚假评论检测问题转化为节点分类问题。其次,利用图卷积网络聚合相邻节点的邻域信息,深入挖掘评论间的相似性关系,获取包含评论间相似性的特征向量进行虚假评论检测。在虚假评论检测通用数据集上,与CNN、LSTM、Text_GCN等模型相比,该方法将准确率分别提升了7%、4.8%与1.3%。(2)提出一种融合情感特征的虚假评论检测方法。为了达到鼓吹宣传的效果,虚假评论表现的情感通常比较强烈,但是现有的基于情感特征的虚假评论检测方法大多仅对评论中的情感词进行简单的统计计数,忽略了不同情感词有程度差别的重要属性。为此,提出一种新的融合情感特征的虚假评论检测方法。该方法首先基于评论文本构建情感词典,综合考虑情感词的不同形式及情感词与程度副词的依赖关系,对评论文本表达的情感更加准确地量化描述;然后,将情感特征与文本内容特征融合,结合Transformer模型实现虚假评论检测。在Amazon数据集上,与LSTM模型相比,该方法在提高检测效率的同时,将准确率提升了0.59%。(3)考虑到一条虚假评论可能同时具有上述两方面特征,将上述两种方法中提取到的蕴含评论间相似性与评论情感强度的特征进行融合,设计了基于多线索的虚假评论检测方法,并基于该方法设计并实现虚假评论在线检测系统。系统分为服务端与客户端两个模块。服务端主要实现评论数据的采集、基于多线索的虚假评论检测模型训练以及评论的在线检测等核心功能;客户端主要实现评论检测任务管理及评论检测结果的展示。在Amazon数据集上,基于多线索的检测准确率与单独使用上述两种方法相比分别提升3.24%与1.14%。实验结果表明融合评论间相似性和情感强度两方面特征具有有效性。同时,利用大众点评网站的评论数据验证了该系统可以实现评论的自动采集和虚假评论的在线检测。
其他文献
随着人工智能的蓬勃发展,可穿戴式压力传感器受到了前所未有的关注。导电高分子复合材料(Conductive polymer composites,CPCs)基压力传感器以柔性好、成本低、易于规模化生产等独特的优势已经成为当前的研究热点,但其高灵敏度和宽响应范围难以兼得、耐疲劳性差、热力学性能不稳定等问题仍亟待解决。因此,本论文以强度高、温度耐受性好的聚酰亚胺(Polyimide,PI)为高分子基体,
三阴性乳腺癌(TNBC)是一种缺乏雌激素受体(ER)、孕激素受体(PR)和人表皮生长因子受体(HER-2)的乳腺癌,具有恶性程度高、易复发、易转移及预后差等特点,因此目前尚无针对TNBC的靶向治疗策略。研究表明,转移是造成三阴性乳腺癌患者死亡的主要因素,而转移作为一个复杂的病理过程,雌激素和血小板在此过程中起着重要的驱动作用。雌激素不仅能提高肿瘤细胞的增殖速率,还能增加肿瘤细胞基质金属蛋白酶2(M
背景与目的食管鳞状细胞癌(esophageal squamous cell carninoma,ESCC)是我国的高发肿瘤之一,目前患者的五年生存率仍低于20%。尽管在ESCC的诊疗方面已经取得了一定的进展,但是大家的关注点仍然主要放在负责编码蛋白质的一小部分DNA序列上,随着高通量测序技术的快速发展,大量长链非编码RNA(Long non-codingRNA,lncRNA)分子被鉴定,并发现其与
研究背景人工膝、髋关节置换术(Total joint arthroplasty,TJA)是骨关节科常用的一种缓解关节疼痛、改善下肢力线、重建关节功能和治疗终末期关节疾病的一种快速有效的方法,它能使关节严重疼痛和功能受限的患者恢复活动能力和提高生活质量。真菌性假体周围感染(Prosthetic joint infection,PJI)是TJA术后感染最严重、最难以处理的并发症之一,它的发生使得患者对
压电超声电机是一种新型的驱动器,具有结构灵活,形式多变,质量轻,断电自锁,控制精度高,响应速度快,抗电场和磁场等的干扰等特点,具有广阔的应用前景。在技术范畴内单个振动模式、简单谐振模式超声电机已趋于成熟,但多维度振动模式超声电机研究较少。本文针对多自由度超声电机,提出一种新结构形式的多自由度超声电机。并对其进行了理论分析和实验研究。主要研究内容如下:1.新型结构多自由度超声电机工作原理的振动模式分
混匀仪是医学和生物学实验室常用的混匀仪器,如酶反应、细胞分离及PCR反应体系等实验对于混匀仪的需求越来越高,稳定的混匀振幅、精确的混匀转速控制及温度控制是混匀仪的核心功能。本课题设计一种可以应用于医学和生物学实验室中的精密型恒温混匀仪,结合虚拟样机技术,从三维建模到静、动力学分析,最后到试验样机的搭建和性能测试,践行了一套完整的研发流程,具有较强的实际工程意义。主要完成以下工作内容:(1)根据本课
本文主要工作是使用有限元方法来研究两类非定常非线性偏微分方程的超逼近及整体超收敛性质.首先,基于双线性元和零阶Nédélec元所构成的单元对Q11/Q01×Q10,构造了非线性Sobolev方程的一个协调扩展混合元新模式.根据单元的高精度特性,并借助于插值和投影相结合方法,平均值技巧和插值后处理技术,导出了相关变量在半离散和全离散格式下的超逼近和超收敛结果.其次,我们利用双线性元研究了非线性波动方
内燃机作为许多机械设备的动力源,在机械领域应用甚广,缸套或无缸套缸体与活塞环的滑动摩擦副作为内燃机的主运动副,其摩擦造成的能量损耗约占内燃机总能量损耗的一半以上。为了改善缸套、无缸套缸体内表面的摩擦磨损状况,使用激光在其内表面加工出有一定规律的微观织构形貌的方法应运而生。大量理论研究和试验都证明:在缸套-活塞环摩擦副接触面上加工与润滑性能要求相匹配的微观织构形貌,可以大大改善其润滑性能,减少油耗,
工程实际中大部分零件都工作在非稳态工况下,针对非稳态点接触弹流润滑求解算法计算效率低、耗时冗长等问题,提出了非稳态点接触弹流高效直接算法。基于高效直接算法,通过对滚子端部进行修形,以改善接触副摩擦学性能,提高其使用寿命。采用等温点接触弹流直接算法,对四种凸型有限长滚子进行了分析,得出了有益的结论。主要完成的工作包括以下两部分:1.通过将求解点接触弹流润滑的“列向分块、逐列求解”思想推广到非稳态弹流
计算机断层成像(Computed Tomography,CT)技术能对物体内部结构信息实现非接触、快速且高效成像,已广泛应用于医学临床诊断中。CT成像技术给临床诊断带来便利的同时,其本征的辐射剂量问题则一直是公众关注的焦点;因此,低剂量CT(Low-Dose Computed Tomography,LDCT)已成为临床CT成像技术的发展趋势。然而,降低辐射剂量会使投影数据的统计噪声增大或采样数量降