论文部分内容阅读
随着移动互联网平台的蓬勃发展,越来越多的人们倾向于对已有的消费做出客观地评论,表达自身观点,在此背景下,产生了大量的文本评论数据,其包含了消费者对产品真实感受的数据。挖掘这些文本数据所蕴含的情感体验并进行个性化推荐分析,不仅为消费者快速抉择带来了很大的便利,而且也为商家进一步制定未来发展战略提供了有效的参考。在目前的情感分析研究中,往往倾向于关注文本语料的领域特征,而忽略了文本自身的特点,尤其是对于长短文本相结合的语料的研究更是缺乏。同时,由于情感分析的结果具有多样性,导致了将个性化推荐引入情感分析领域的相关研究存在着很大的不足。以此为出发点,本文主要进行了两方面的研究。一方面,对长短文本相结合的评论语料进行了基于深度学习的情感分析,并通过对比实验选取了该语料特征下的最优模型;另一方面,在情感分析的基础上,运用关键词技术和词移距离相似度进行个性化推荐研究。具体地,运用爬虫技术获取长短文本相结合的酒店评论语料,进行了语料清洗、文本分词、去停用词、文本向量化以及语料token化的语料预处理工作,在此基础上,对其实现了基于传统RNN模型、RNN变体(LSTM、GRU)模型以及双向RNN(Bi-LSTM、Bi-GRU)模型的情感分析研究,实验结果显示,Bi-GRU模型在该语料特征下的情感分析效果最好,测试集准确率达到了97.64%。在情感分析的基础上,本文运用TextRank技术分别提取了正负两类顾客评论的关注特征,并计算了顾客关注特征与正类评论文本的词移距离相似度,以此为依据进行对不同顾客需求得相关推荐,实验结果显示排名前三的推荐文本与顾客需求的相似度均达到99%以上。本文的主要贡献为对长短文本相结合的评论语料搭建了5种不同的RNN模型,并通过对比实验确定了针对该语料特征的最优模型。同时,在情感分析的基础上进行了个性化推荐研究,使得文本情感分析的结果更具应用价值。