论文部分内容阅读
随着智能终端的迅速普及和信息技术的迅猛发展,用户评论性文本数量呈指数级爆炸性增长,针对蕴含用户情感态度的观点进行分析不仅可以促进舆情监控、营销策略等应用的发展,还可以用于对话式推荐系统的精准优化。如何精准地进行情感分析已成为当前工业界和学术界的迫切要求,这也大力促进了情感分析成为自然语言处理研究领域的一个热点研究方向。以往的基于深度学习的情感分析模型主要是针对句子整体进行处理,对于句子在细粒度方面的情感则难以有效识别,同时由于用户评论文本多为短文本也导致了现有模型不能充分挖掘其中蕴含的情感特征信息。因此,本文针对细粒度的情感分析任务,基于深度学习技术和以往的研究成果由浅入深的进行研究,主要研究工作如下:第一,针对方面级情感分析任务提出了基于门机制和级联网络的深度网络模型GRCNN-HBLSTM。该模型首先在词向量表示部分将字符级别卷积网络与传统词向量融合作为门机制的输入从而获得最终的词向量表示,随后将词向量与方面词、主题词一起作为后续模型的输入,继而通过区域CNN与基于层次机制的双向LSTM网络结合用于获取特定方面的情感特征信息的同时提升训练速度。并通过与现有典型模型的实验结果对比,验证了该模型在方面级情感分析任务上具有更好的性能表现。第二,针对目标级情感分析任务提出了一种动态自适应的层次网络模型GC-HLSTM。该模型在基于方面的情感分析模型的基础上继续优化,主要优化之处有两个方面:一是词向量表示部分,即:将传统的word2vec替换为ELMO机制,继而通过门机制获得最终的词向量表示;二是针对该任务联合层次机制和注意力机制建立了层次注意力网络,用于获取特定目标在词语层和句子层两个层面的情感特征。并通过与现有典型模型的实验结果对比,验证了该模型在目标级情感分析任务上的有效性和更好的性能表现。第三,考虑到方面级和目标级两个情感分析模型针对更细粒度的目标关联方面级情感分析任务不能同时捕捉目标以及关联方面的情感联系,因此提出了一种基于BERT预训练与TextCNN的深度网络模型SRC-TBERT。该模型首先针对现今少样本导致语义理解不足的缺点提出了基于BERT的掩码数据增强方法,进一步扩大了样本规模。随后该模型将该情感分析任务转变成情感阅读理解任务并基于构建的TBERT预训练模型进行微调。最后通过与现有先进模型的实验结果对比,验证了该模型在目标方面级情感分析任务上具有更强的性能的同时也提升了训练速度。