基于深度学习的多维特征虚假评论检测算法研究

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:nemosan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务的迅速发展,网上购物逐渐发展成为人们购物的主要方式。由于网上购物中的消费者与电商平台商家信息不对称的特点,在网上购物的过程中,电商平台中的商品评论信息逐渐成为消费者网购决策的主要依据。但是,由于利益的驱使,越来越多的商品虚假评论信息出现在消费者面前,并且由于网络水军、网络职业写手的存在使得商品的虚假评论与真实评论的区分难度越来越大,使得消费者不能直观的获取到买家对商品购买体验与使用体验的反馈信息,因此商品虚假评论检测研究随之展开。随着研究者的不断努力,越来越多的虚假评论检测方法被提出来。然而面对当今虚假评论具有很高仿真性的特点,当前的虚假评论检测方法慢慢暴露出局限性:基于评论内容特征的检测的传统机器学习方法,对于自然语言处理领域,语言特征的提取对于领域知识具有很强的依赖性,算法识别能力较差,泛化能力较弱,误判率较高;人为虚假评论具有很高的仿真性,单纯从评论内容这一维度特征构建模型对虚假评论识别具有一定困难。针对以上问题,本文提出了一种基于深度学习的多维特征虚假评论检测模型。该模型使用深度学习中的双向长短时记忆网络模型(Bi-LSTM)来获取商品评论文本内容的上下文语义信息特征来取代传统机器学习中人工特征选择过程。同时加入评论内容自身特征、评论者行为相关特征、商家行为相关特征并使用卷积神经网络(CNN)通过不同步长的卷积核(filter)进行特征组合来帮助区分仿真性很高的难以识别的虚假评论。最后本文将注意力机制(Attention Mechanism)加入到基于深度学习的虚假评论检测模型中来调整多维特征对最终分类结果的影响权重,提高模型检测的准确率与召回率,同时注意力机制可以对特征权重高可视化输出展示,提高用户对虚假评论识别的置信度。
其他文献
介绍上海仲盛商业中心逆作区桩基工程中一柱一桩的施工技术和施工质量保证措施,以及对一些不足之处进行改进的设想.
本文报道由环形自泵浦相位共轭振荡器(采用KNSBN:Ce晶体)所产生的相位共轭波和47%的自泵浦反射率以及在这一装置还观测到利用晶体缺陷对光的散射作用使人轭波增强,衍射光环增亮。
ROF(光载无线射频)技术为高速移动通信提供了一种可靠的方案,其应用涵盖了光纤拉远雷达系统、光子卫星通信、智能交通系统、移动蜂窝通信等领域。目前,美国、日本、欧洲等发
志怪小说,是继承神话小说的传统,发展形成的一种独立的文学体裁。六朝是志怪小说的成熟和鼎盛时期,此时志怪作品数量众多,作者队伍庞大。上自皇帝,下至士众,无所不有。这一时期的志怪小说虽然大都仍是“短书”,但篇幅有变长的趋势,描写手段也大大提高,题材极为广泛。后代许多故事模式都可以从这里找到雏形,思想内容上也一定程度反映了六朝之时的社会生活和政治状况。六朝志怪小说主要记载的是神鬼怪异故事,作为一种独立的
毛泽东是新中国外交战略与外交政策的主要制定者,是杰出的国际战略家和外交家。毛泽东外交思想对中国和世界都产生了重大影响,它奠定了新中国走向世界的坚实基础。而习近平外交思想是新时代的最新外交理论成果,是我国正在贯彻与实施的外交理论方针与政策。毛泽东的外交思想与习近平的外交思想是一脉相承的,习近平外交思想是对毛泽东外交思想的继承与发展。研究分析习近平对毛泽东外交思想的继承与发展,对二人外交思想进行比较研
对一些地方政府投资工程投资失控的主要原因进行分析,探讨了对投资控制进行有效管理的主要模式提出了控制投资的几个重点工作.
2005年,天津市计划投资24亿元,启动“历史名校”建设规划和示范性幼儿园建设规划,争取在建与竣工面积分别达到180万m^2和100万m^2。根据建设规划,年内基本建60所左右示范性高中校
新闻热线作为媒体与读者沟通的桥梁和纽带。媒体通过新闻热线的接听工作,使它成为关注百姓生活,联系读者群众的一条“生命线”,不断地扩大报纸的影响力。如何做好新闻热线的接听
近年来,高校大学生自杀事件频频发生,引起了社会各界的广泛关注。自杀意念作为自杀风险的重要预测因子,成为预防自杀行为的关键性因素。生活事件作为外界诱发因素,对自杀意念
局部挖深12.4 m的深基坑与距基坑2.7 m的大直径顶管同步施工,场地狭小、工况及周边环境复杂,通过优化基坑支护、施工技术,控制围护变形、确保顶管、基坑及周边环境的安全,并