【摘 要】
:
电子商务的快速发展使得在线购物变得普及,商品评论作为最重要的用户反馈,其数量正呈现爆炸性增长。基于公平性以及刺激用户的互动性,电子商务平台大多会公开商品的评论,这使
论文部分内容阅读
电子商务的快速发展使得在线购物变得普及,商品评论作为最重要的用户反馈,其数量正呈现爆炸性增长。基于公平性以及刺激用户的互动性,电子商务平台大多会公开商品的评论,这使得该类型的用户反馈不仅能指导商家改进服务和产品质量,也能为其他用户的购买决策提供参考。好评率高的商品能吸引更多的购买量,反之则会严重影响销量。基于此,商品评论成为了商家争夺的战场,一些无良商家会通过给自家商品“刷好评”或者给竞争对手的商品“刷差评”的方式误导消费者,导致不正当竞争。本文分析了真实和垃圾评论的异同,基于WebQM模型分析垃圾评论的多维度特征,从评论源维度,评论内容维度,以及评论表达维度捕捉垃圾评论的具有高区分度的特点。通过应用或改进两类分类算法,实现垃圾评论检测,取得了较好的检测效果。本文采用了两个真实的商品评论数据集。针对已标注的黄金标准数据集,本文从评论内容、评论表达两个维度对垃圾评论与真实评论的不同点进行分析了并提取特征,改进了传统的PU学习算法,应用于垃圾评论检测实验。通过比较不同算法的检测性能,验证改进型PU学习算法在垃圾评论检测中具有优势,实现了 86%的F1值。针对未标注的亚马逊数据集,本文首先进行Simhash标注并构建了容量为3000条的实验样本集,通过对数据集中各属性数据特点分析,提取了评论源维度特征,同时基于亚马逊数据的特点扩充了评论内容及评论表达特征。在此基础上,本文对数据集不平衡问题进行处理,将GBDT梯度提升决策树算法应用至亚马逊数据集垃圾评论检测,并与其它算法进行了效果对比,GBDT算法达到最优的88%的F1值,优于其他算法。
其他文献
在科学领域与信息技术不断地迅速进步的近些年来,信息共享与资源互利已经越来越受到人们的各种关注。与此同时,这些信息资源给人们带来各种生活中的好处,也带来了人们隐私数据信
随着计算机数字化和可视化技术的发展,对文化遗产的数字化保护和虚拟展示也提出了更高的要求。秦始皇陵陪葬坑中的兵马俑文物原本是周身彩绘,但由于千年来的自然侵蚀和考古发
随着信息技术和多媒体技术的快速发展,音乐已经成为人们日常生活中不可或缺的多媒体资源之一。同时,音乐作为人类最重要的交流媒介之一,包含着丰富的情感信息,利用计算机技术来分
虚拟现实技术是伴随多媒体技术发展起来的计算机新技术,采用三维图形生成技术、高分辨率显示技术和多传感交互技术,生成一个逼真的三维虚拟环境。虚拟现实技术的应用前景是非常
随着企业业务流程的日益复杂,作为一种流程定义、管理和监控的核心技术,工作流技术已经得到广泛应用。一个完整的工作流管理系统一般应包括过程与任务定义、过程定义的完整性
在计算机网络技术飞速发展的背景下,互联网环境下的软件形态和功能正发生着深刻的变化,这给国产办公软件的发展带来了机遇,网络集成化办公已成为趋势。在该领域中,SaaS(Software-a
随着软件产品广泛应用于工业制造、金融、交通运输、军事等领域,随着软件的规模和复杂度不断增加,如何保证软件产品的质量和可靠性成为软件工程研究的重点和难点。软件缺陷是影
随着信息技术的飞速发展,数据积压现象越来越严重,人们面临海量数据却无从下手,数据挖掘技术的诞生,使得人们从这样的尴尬情形中解放出来。作为数据挖掘领域的一个重要分支,关联规
无位置传感器无刷直流电机因其结构简单、成本低廉、运行可靠等优点在工业、农业、民用等众多领域得到了广泛的应用。然而,无位置传感器无刷直流电机仍然存在换相转矩脉动大、换相时间难以准确控制等问题。针对此类问题,本文采用空间矢量脉宽调制(SVPWM)技术较好地解决了存在的问题,研究内容如下:首先,介绍了无位置传感器无刷直流电机位置检测方法的国内外研究现状,对比分析了传统的反电动势过零检测端电压检测法与相电
可编程逻辑控制器(PLC)在现代工业自动化生产中发挥着极其重要的作用。经过40多年的发展,PLC的功能已得到很大拓展,大部分PLC厂家的产品己具有运动控制功能,如定位、直线插补