论文部分内容阅读
复杂语境下中文短语的情感极性分析在机器学习领域一直是一个难题,直到神经网络的出现才为解决这一问题打开了一扇窗户,并成为神经网络研究的一大热点领域。本论文旨在通过给时间卷积神经网络模型(TCN)引入注意力(Attention)机制来解决这一难题。本论文选取电子商务平台上的商品评论短语作为研究对象,让机器自动分析判断每条评论短语的情感极性(积极、消极),最终得出对商品的综合评价。为了分析短语的情感极性,首先引入了词向量嵌入机制将文本信息映射为向量数据,再选取目前较为成熟的循环神经网络模型(LSTM、Bi-directional LSTM、LSTM Attention)和时间卷积神经网络模型(TCN)在电商评论数据集上进行训练测试,通过对比分析这些模型的测试结果,本文指出LSTM Attention模型的准确率以及F1-Measure明显优于未引入Attention机制的LSTM、Bi-directional LSTM、TCN模型,而在未引入Attention机制的LSTM、Bi-directional LSTM、TCN三个模型中,TCN模型在训练过程中的表现又优于LSTM、Bi-directional LSTM模型的结果,于是自然而然地产生了将TCN模型与Attention机制相结合的想法。通过进一步的试验,发现电商评论数据集在TCN Attention模型上的训练测试指标明显优于在前面各模型上的指标,这就证明了将TCN模型与Attention机制相结合的正确性以及创新性。其次,本论文还对模型的误识别问题进行深入分析,并通过对数据集进行扩展,引入第三种情感类别来对TCN Attention模型进行训练,通过此方法使得模型的准确率以及F1-Measure得到进一步的提升。为了将情感分析模型进一步推向实用化,本论文给出了基于深度学习的电商评论情感分析系统的实现方案,该方案基于Keras+Tensorfow机器学习平台。电商评论情感分析系统包括线下模型训练和线上推理应用两大部分,系统的整体架构和主要功能模块在论文中都进行了详细的设计和说明,为代码实现奠定了良好的基础。本论文对于目前各种成熟的循环神经网络和卷积神经网络模型进行了深入研究,对在数据收集、预处理和模型设计、优化过程中遇到的问题进行了深层次的剖析,最终在TCN Attention模型的设计和构建过程中做到了扬长避短的效果,使得TCN Attention模型在电商评论系统中表现出优越的性能。最终,本论文提出的TCN Attention模型在测试集数据上达到准确率:94.94%;“积极”情感类别上精确率:94.08%、召回率:92.30%、F1-Measure:93.18%;“消极”情感类别上精确率:93.66%、召回率:93.90%、F1-Measure:93.77%的成绩,相较于其他模型有较明显的提升。本论文最后展望了TCN Attention模型在互联网时代电子商务评论系统中应用的广阔前景,同时指出了TCN Attention模型未来迈向实用化需要进一步研究解决的问题和优化提升的工作。