论文部分内容阅读
目前,互联网包括社交网站、电子商务网站以及论坛等网站已经得到了快速发展,大量的用户可以随时随地的进行评论文本信息的发布、分享和更新。在多种多样的信息中,商品评论信息是非常重要的一类。电子商务的快速发展,带动了许多用户习惯在网上进行购物消费,同时,这些网站也为消费者提供了发表评论的平台。商家通过收集这些评论信息进行一系列分析,更好的为顾客服务。其中,文本情感分析是从评论中获取有用信息的重要部分,了解商品评论的情感趋向更好的改进商品的质量或销售策略,从而满足用户的喜好,促进产品销售。传统迭代神经网络(Recurrent neural network,简称RNN)模型虽然在理论上可以覆盖文本中整个句子的时序信息,但实践表明,由于梯度消失的原因,RNN语言模型无法识别较长文本的句子。本文针对传统RNN模型中存在的问题,尝试使用长短时记忆网络(Long Short-Term Memory,简称LSTM)模型的思路加以改进。由于LSTM模型可以保存较长文本的信息,在中文文本情感分析中发挥语言模型的优势,所以本文将使用LSTM模型作为语言模型对中文文本进行情感分析,LSTM语言模型可以有效的获取文本完整的时序信息,通过加入门的结构,来去除或者增加信息交互的能力。LSTM模型相比传统的RNN模型在实验效果上有了一定的改善。最后,本文将LSTM模型与其他两种模型进行融合,进一步提高模型对文本情感分析的准确率。