论文部分内容阅读
进入二十一世纪以来,随着互联网的发展与普及,微博、博客、论坛及电子商城等一系列平台为人民提供了自由发表言论的舞台。互联网中每天会产生大量的文本信息,如何从大量的文本信息中精准获取到文本包含的情感信息,是目前文本情感分析领域研究的热点。但是传统的文本情感分析存在以下缺点:(1)人工定制的特征提取策略主观性太强,有些隐藏的情感信息得不到有效的表达;(2)提取到的特征过于简单,无法有效表达文本中几个关键词的依赖关系。近年来深度学习在多个领域都取得了瞩目的成就,从而也证明了其在文本分析上的独特优势。本文使用双向门控循环单元(BiGRU)深度学习模型与内容注意力机制(Content Attention Mechanism)相结合的方式来对文本情感分析做了深入的研究。本文主要包括以下工作:(1)针对文本情感分析问题,本文使用双向门控循环单元(BiGRU)网络模型和双向长短期记忆(BiLSTM)网络模型、双向循环神经网络模型(BiRNN)、门控循环单元(GRU)网络模型、长短期记忆(LSTM)网络模型、循环神经网络(RNN)模型、卷积神经网络(CNN)模型做对比,分析不同深度学习模型在情感分析上的效果。(2)由于文本中不同词对情感分析的重要性不同,而注意力机制可以通过计算概率分布,获得了注意力概率分布的语义编码,从而可以突出关键词在文本情感分析中的作用。本文在模型中使用内容注意力机制(Content Attention Mechanism)和普通的注意力机制进行对比,分析不同的注意力机制在情感分类上的效果。(3)使用深度学习模型与注意力机制相结合的方式进行实验,通过上述不同的深度学习模型和注意力机制做结合,分析不同组合的模型在数据集上进行情感分析的效果。我们在亚马逊的商品评论数据集和IMDB的英文影评数据集上分别进行了实验,实验结果表明,与传统的文本情感分析方法相比,本文提出的基于内容注意力机制的双向门控循环单元网络模型都具有更好的分类效果。