基于深度学习的商品评论情感分析

来源 :东华大学 | 被引量 : 0次 | 上传用户:hnyinhao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着中国互联网发展水平的不断提高,人们在网络上留下的评论数量与日俱增,同时由于电商平台的发展,给人们的生活方式带来巨大的变革。电商平台的商品评论文本对人们能否如愿购买到自己心仪的商品以及电商平台的良好发展都具有重要意义。因此,对网络上的商品评论文本进行情感倾向分析可以为商家和消费者提供有价值的参考意见。
  商品评论文本的情感分类主要是依靠人工进行判别的方法,人为的将文本进行分类,容易出现标准不一、效率低下、劳动强度大等问题。早期对文本情感的分析工作主要是对情感词的分析和语法规则的判定,很大程度地依赖于情感词典资源,需要大量的前期工作和语言学知识。随着机器学习的发展演变,开始采用机器学习的方法,但是这种方法需要人为设计特征进行抽取。因此在面对文本数量剧增的压力之下,效率和准确性方面都急需提高。本文采用深度学习的算法来对商品评论文本进行情感分析,探讨深度学习方法在文本领域的应用。本文的主要研究工作包括:
  (1)首先对网络上不规则的评论文本进行预处理,包括中文分词,词性标注等操作,并根据网络商品评论的特点进行了去除停用词和特殊字符的操作,然后研究了对中文文本进行向量化表示的几种词向量模型,为后续的实验提供基础。
  (2)本文针对商品评论文本的特点对传统的情感分析方法进行优化,通过有关商品评论数据集进行训练,并通过不同方法生成的词向量表示对商品评论情感分析的效果进行实验,得到在不同词向量维数下的模型的性能,实验结果表明采用Glove词矢量模型的分类精度略高于Word2vec。
  (3)通过对传统情感分析算法的研究改进,提出了采用深度学习模型来进行商品评论的情感分析,主要采用了卷积神经网络(CNN)和循环神经网络(RNN)的方法对文本的情感倾向进行分类,并且对于循环神经网络的长期依赖问题,采用长短时记忆网络(LSTM)来学习商品评论的上下文信息。最后提出集成这两个模型的深度学习算法CNN-LSTM 和 LSTM-CNN 来进行商品评论的情感分析。其中通过LSTM-CNN 模型取得了最高的 92.6%的准确率,证明了本文提出算法的有效性。最后对比了其他算法模型和深度学习模型的实验结果,实验表明采用深度学习的方法取得的准确率明显高于其他算法,本文提出的方法对商品评论情感分类的效果最好。
其他文献
在同步发电机组中,励磁系统是很关键的构成要素,其技术性能直接影响到发电机组以及电力系统功能运转的稳定性与可靠性。良好的励磁系统可以提高电网的稳定性和运行的关键技术经济性能指标,保障发电机与电力系统更好地完成工作。  本文首先简单分析了发电机励磁系统发展趋势,然后分析了水轮发电机励磁调节基本原理和励磁系统的分类,并且以蟒塘溪水利水电有限责任公司(蟒塘溪水电站)目前水轮发电机的励磁系统为实例,将详细分
近年来,一种新型的发光材料,有机一无机杂化型卤素钙钛矿,因为在钙钛矿太阳能电池中的卓越表现,越来越受到光电领域学者们的关注。这种材料在显示领域也有良好的发光性能,通过卤素离子的调控可以实现发光范围在可见光区域的全覆盖,对LED的发展有着深远意义。但是有机一无机钙钛矿含有有机胺,此材料稳定性差,对光、热、水环境十分敏感,大大限制了在器件方面的应用,用无机离子替换有机胺制备全无机钙钛矿可以极大提高材料
过去的几十年里,随着基于硅(Si)材料的电力电子器件的发展,其电学特性已经趋于材料特性所决定的理论极限,这也严重制约了电力电子器件在高频、高温、高压等领域的应用。而碳化硅(SiC)作为新型宽禁带半导体材料,其禁带宽度、临界击穿电场、饱和电子漂移速率以及热导率等特性都大大优于Si材料,因此SiC功率半导体器件拥有更高的耐压水平、更高的开关频率和更高的工作温度从而可以大大提升电力电子系统的各方面性能。
~~
随着可再生能源发电注入比例的不断提高,电力系统的等效惯量相对减少,对电网严重功率缺额下的调频造成了很大压力。而在各种可再生能源发电类型中,风力发电具有大规模集中式并网的特点,相比分布式发电更容易接受调度与控制,因此,如何挖掘风力发电系统的调频潜力已经成为国内外研究的热点。在目前已有的风电机组参与调频的控制方法中,基于转子动能控制的基于双馈感应发电机的风电机组(简称为“DFIG风电机组”)的调频策略
非线性负载的大量应用给电网造成了严重的谐波污染。并联型有源电力滤波器(Shunt Active Power Filter,SAPF)是抑制电网谐波的常用解决方案之一。在含有复杂用电负荷的电网环境下,传统锁相环很难准确地检测出电网电压的相位,这会造成SAPF的输出电流无法与负载电流同步,达不到令人满意的谐波补偿效果。另一方面,传统的谐波检测技术和电流控制技术很难使SAPF在保证良好的稳态精度的同时获
长空气间隙放电机理研究不仅对于改善电力系统外绝缘设计和雷电防护具有重要意义,而且还可以提供与放电现象相关的一般概念与基本认知。末跃阶段作为长空气间隙放电的最后一个过程,决定了放电通道的落点。由于缺少实验观测诗句,目前对末跃阶段的特性研究十分有限。因此,本文将重点研究正极性操作冲击电压和雷电冲击电压下长空气间隙放电的末跃阶段特性。  本文建立了正极性长空气间隙放电多物理量同步观测试验平台,实现了放电
学位
飞轮储能具有功率密度高、使用寿命长、充放电次数无限制、环境友好、占地面积小等优点,在可再生能源并网的分级储能电源、航天器储能和调姿、电磁发射脉冲功率电源等方面有着广阔的应用前景。在飞轮储能系统中,飞轮储能电机是机电能量转换的核心,其性能优劣直接影响整个飞轮储能系统的性能。因此,飞轮储能电机对于整个飞轮储能系统至关重要。在众多电机拓扑结构中,感应子电机因其实心转子强度高、结构简单、无刷励磁、易于冷却
近年来,随着信息时代的发展,人们在室内环境下对位置获取的需求越来越大。目前,全球定位系统(Global Positioning System, GPS)在室外环境的应用已变得非常成熟,但是由于 GPS 在室内环境下受建筑物干扰较大,导致定位效果不理想,因此对室内定位相关技术的研究成为当下的热点。如何开发室内定位系统及使其商业化显得尤为关键。  本论文在前人研究的基础上,对室内定位相关技术进行了进一
学位
智能交通系统近些年来迅猛发展,具有重要的研究价值和广阔的发展前景。其通过人、车、路之间的和谐、密切配合提高整个交通运输效率,缓解交通堵塞,提高路网通过能力,减少交通事故,降低能源消耗,减轻环境污染。车载自组织网络是智能交通系统的重要组成部分,基于车载自组织网络的城市交通管理是当前的一个重大热点研究内容。随着人们生活水平的不断提高和城市的快速建设,机动车的刚性需求不断旺盛,车辆数的迅速增长使得城市道