论文部分内容阅读
随着中国互联网发展水平的不断提高,人们在网络上留下的评论数量与日俱增,同时由于电商平台的发展,给人们的生活方式带来巨大的变革。电商平台的商品评论文本对人们能否如愿购买到自己心仪的商品以及电商平台的良好发展都具有重要意义。因此,对网络上的商品评论文本进行情感倾向分析可以为商家和消费者提供有价值的参考意见。
商品评论文本的情感分类主要是依靠人工进行判别的方法,人为的将文本进行分类,容易出现标准不一、效率低下、劳动强度大等问题。早期对文本情感的分析工作主要是对情感词的分析和语法规则的判定,很大程度地依赖于情感词典资源,需要大量的前期工作和语言学知识。随着机器学习的发展演变,开始采用机器学习的方法,但是这种方法需要人为设计特征进行抽取。因此在面对文本数量剧增的压力之下,效率和准确性方面都急需提高。本文采用深度学习的算法来对商品评论文本进行情感分析,探讨深度学习方法在文本领域的应用。本文的主要研究工作包括:
(1)首先对网络上不规则的评论文本进行预处理,包括中文分词,词性标注等操作,并根据网络商品评论的特点进行了去除停用词和特殊字符的操作,然后研究了对中文文本进行向量化表示的几种词向量模型,为后续的实验提供基础。
(2)本文针对商品评论文本的特点对传统的情感分析方法进行优化,通过有关商品评论数据集进行训练,并通过不同方法生成的词向量表示对商品评论情感分析的效果进行实验,得到在不同词向量维数下的模型的性能,实验结果表明采用Glove词矢量模型的分类精度略高于Word2vec。
(3)通过对传统情感分析算法的研究改进,提出了采用深度学习模型来进行商品评论的情感分析,主要采用了卷积神经网络(CNN)和循环神经网络(RNN)的方法对文本的情感倾向进行分类,并且对于循环神经网络的长期依赖问题,采用长短时记忆网络(LSTM)来学习商品评论的上下文信息。最后提出集成这两个模型的深度学习算法CNN-LSTM 和 LSTM-CNN 来进行商品评论的情感分析。其中通过LSTM-CNN 模型取得了最高的 92.6%的准确率,证明了本文提出算法的有效性。最后对比了其他算法模型和深度学习模型的实验结果,实验表明采用深度学习的方法取得的准确率明显高于其他算法,本文提出的方法对商品评论情感分类的效果最好。
商品评论文本的情感分类主要是依靠人工进行判别的方法,人为的将文本进行分类,容易出现标准不一、效率低下、劳动强度大等问题。早期对文本情感的分析工作主要是对情感词的分析和语法规则的判定,很大程度地依赖于情感词典资源,需要大量的前期工作和语言学知识。随着机器学习的发展演变,开始采用机器学习的方法,但是这种方法需要人为设计特征进行抽取。因此在面对文本数量剧增的压力之下,效率和准确性方面都急需提高。本文采用深度学习的算法来对商品评论文本进行情感分析,探讨深度学习方法在文本领域的应用。本文的主要研究工作包括:
(1)首先对网络上不规则的评论文本进行预处理,包括中文分词,词性标注等操作,并根据网络商品评论的特点进行了去除停用词和特殊字符的操作,然后研究了对中文文本进行向量化表示的几种词向量模型,为后续的实验提供基础。
(2)本文针对商品评论文本的特点对传统的情感分析方法进行优化,通过有关商品评论数据集进行训练,并通过不同方法生成的词向量表示对商品评论情感分析的效果进行实验,得到在不同词向量维数下的模型的性能,实验结果表明采用Glove词矢量模型的分类精度略高于Word2vec。
(3)通过对传统情感分析算法的研究改进,提出了采用深度学习模型来进行商品评论的情感分析,主要采用了卷积神经网络(CNN)和循环神经网络(RNN)的方法对文本的情感倾向进行分类,并且对于循环神经网络的长期依赖问题,采用长短时记忆网络(LSTM)来学习商品评论的上下文信息。最后提出集成这两个模型的深度学习算法CNN-LSTM 和 LSTM-CNN 来进行商品评论的情感分析。其中通过LSTM-CNN 模型取得了最高的 92.6%的准确率,证明了本文提出算法的有效性。最后对比了其他算法模型和深度学习模型的实验结果,实验表明采用深度学习的方法取得的准确率明显高于其他算法,本文提出的方法对商品评论情感分类的效果最好。