论文部分内容阅读
随着互联网的高速发展,以及互联网用户的爆炸式增长,网购逐渐融入人们的生活,尤其是近些年,网购甚至成为了人们的一种生活方式,在2018年中国网购用户规模约占网民总体的71%,正是由于如此大量网购用户的网购行为,使得在各种电商平台上的评论文本数据呈爆炸式增长,这些评论文本数据大多包含了用户的观点和情感倾向,对这些评论文本进行情感分析逐渐成为自然语言处理领域的重要研究目标。随着数据的爆炸式增长以及计算机技术的高速发展,传统的统计研究方法已经无法满足如今对于大数据分析的需求,因此,本文利用深度神经网络结合集成学习方法,针对从各大电商平台搜集得到的评论数据进行有关情感分析研究。本文首先综合介绍了过去对于情感分析研究所使用的传统研究方法,并且从统计语言模型、词向量以及深度学习模型等方面详细介绍了如今情感分析研究中的主流方法,然后在进行文本向量化时,采用具有时序特征的fasttext词向量代替过去常用的word2vec词向量,解决过去对于文本时序特征表达不足的问题,接下来通过情感词典构建相应词语的情感特征,最后结合神经网络模型和集成学习,对评论文本的情感分析进行了对比实验。实验表明,在情感分析研究中,使用fasttext词向量表示文本,训练得到的GRU模型效果要略优于使用word2vec词向量表示文本所训练的GRU模型,在试验中,无论是使用fasttext词向量或是word2vec词向量,GRU模型的分类准确率都要比CNN模型高3%左右,对于GRU模型中单向循环表达不足的问题,本文采用Bi-GRU模型进行情感分析研究,并且测试集的分类准确率达到91.14%,另外,本文结合集成学习的Bagging方法,训练多个Bi-GRU基学习器进行模型集成,最终的结果在测试集上的分类准确率达到了93.09%,相比未集成的模型提高了约2%的准确率。