基于深度学习集成模型的情感分析研究

来源 :华侨大学 | 被引量 : 0次 | 上传用户:laden167
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的高速发展,以及互联网用户的爆炸式增长,网购逐渐融入人们的生活,尤其是近些年,网购甚至成为了人们的一种生活方式,在2018年中国网购用户规模约占网民总体的71%,正是由于如此大量网购用户的网购行为,使得在各种电商平台上的评论文本数据呈爆炸式增长,这些评论文本数据大多包含了用户的观点和情感倾向,对这些评论文本进行情感分析逐渐成为自然语言处理领域的重要研究目标。随着数据的爆炸式增长以及计算机技术的高速发展,传统的统计研究方法已经无法满足如今对于大数据分析的需求,因此,本文利用深度神经网络结合集成学习方法,针对从各大电商平台搜集得到的评论数据进行有关情感分析研究。本文首先综合介绍了过去对于情感分析研究所使用的传统研究方法,并且从统计语言模型、词向量以及深度学习模型等方面详细介绍了如今情感分析研究中的主流方法,然后在进行文本向量化时,采用具有时序特征的fasttext词向量代替过去常用的word2vec词向量,解决过去对于文本时序特征表达不足的问题,接下来通过情感词典构建相应词语的情感特征,最后结合神经网络模型和集成学习,对评论文本的情感分析进行了对比实验。实验表明,在情感分析研究中,使用fasttext词向量表示文本,训练得到的GRU模型效果要略优于使用word2vec词向量表示文本所训练的GRU模型,在试验中,无论是使用fasttext词向量或是word2vec词向量,GRU模型的分类准确率都要比CNN模型高3%左右,对于GRU模型中单向循环表达不足的问题,本文采用Bi-GRU模型进行情感分析研究,并且测试集的分类准确率达到91.14%,另外,本文结合集成学习的Bagging方法,训练多个Bi-GRU基学习器进行模型集成,最终的结果在测试集上的分类准确率达到了93.09%,相比未集成的模型提高了约2%的准确率。
其他文献
旋转椭球面上的测地线的性质,不仅是微分几何教材中的重要内容,也是大地测量专业中的一个常见的问题。本文主要考虑克莱劳定理在计算测地线弧长中的应用;另外,本文简洁地推出
背景:诱导型一氧化氮合酶mRNA在脑缺血再灌注脑损伤中具有减轻血脑屏障的破坏,保护血管内皮和脑组织的作用。目的:观察电针水沟、内关、足三里对脑缺血再灌注大鼠海马诱导型
随着环境污染的日益严重和我国老龄化人口的加速发展,慢性阻塞性肺气肿(COPD)的发病率呈现逐步上升趋势,以中老年人为多见。慢性阻塞性肺气肿在急性加重期由于增加的气道阻力和
涂尔干把卢梭当作社会理论的重要开端,理由是卢梭发现了社会秩序具有"自成一类"的特征。不过,基于"民情"(moeurs)这一概念的双重特征,我们需要继续追问个体与民情风尚在现代
在人工智能技术正在被广泛且深入使用的领域当中,教育科技中的语言学习领域,无疑是最受关注且最被期待发生革命性变革的领域之一。诸多具有代表性的人工智能技术,如语音识别
目的探究右美托咪定与育亨宾对慢性应激小鼠抑郁的影响:方法将筛选出的40只昆明小鼠随机分为4组(n=10):对照组、模型组、右美托咪症组、育亨宾组。除对照组外,每组均通过慢性
本文从鸦片战争后帝国主义的入侵、清政府内外政策的调整和自然灾害的频频发生等方面分析了晚清农业衰退的原因 ,提出了自己独到的见解。
精准扶贫脱贫攻坚阶段,贫困地区、发达地区、贫困人口、贫困地区地方政府、龙头企业、农民合作社等产业脱贫主体之间形成了复杂的网状嵌入关系。产业脱贫嵌入的实质是各个主
2014年3月28日,是第六个西藏百万农奴解放纪念日,距离1959年西藏民主改革已经55个年头了。在这个值得纪念的日子里,笔者以“西藏民主改革第一村”——克松村为视角,再次回顾55年
报纸
<正>随着中国居民生活水平的提高和卫生保健事业的持续发展,我国居民的平均寿命不断增加。中国社科院发布的《中国老龄事业发展报告(2013)》指出,我国老年人口已经突破2亿,并且