论文部分内容阅读
随着现代化网络的普及,个人对产品、服务或事件生成的评论可以使组织和企业改善市场营销、沟通、生产和采购。基于此,对句子情感分类便于从用户生成的评论或叙述中提取主观信息,一般是判断句子情感极性。传统情感分析方法仅统计单词或短语的频数获得句子表示,基于深度学习的序列模型虽被广泛应用到句子情感分类中,但其也不能体现句子语法和句法结构,直接影响后续句子情感分类性能。本文对循环神经网络和树结构网络进行改善以得到更好展现句子语义特征的句子表示,以网络用户评论数据为对象进行情感分类,主要工作如下:(1)提出融合极性转移和长短期记忆网络(Long Short Term Memory,LSTM)的树结构网络模型。基于树结构的LSTM网络可以获取句子的语法结构特征信息,但是忽略了单词的情感极性转移信息。针对这个问题,本文提出了融合极性转移和LSTM网络的树结构网络模型,首先构建依存句法结构树和短语结构树网络,在网络节点中添加LSTM的记忆模块来长期保存节点的语义信息,然后本文在LSTM的记忆模块中添加了情感极性转移向量以获取节点的极性转移信息。与已有的深度学习模型相比,本文模型在SST数据集上句子情感分类效果的准确率有所提高。(2)提出基于修辞结构理论、门控循环单元(Gated recurrent units,GRU)和注意机制的树结构网络模型。利用短语结构树和依存句法结构树能够获取语法结构信息,很好地丰富句子的语义表达,但是不能着重处理句子重要片段;而且GRU网络记忆模块相比LSTM更加简单有效。针对这些问题,本文提出了基于修辞理论结构解析树的GRU网络模型,利用修辞理论解析树区别子树重要性,并使用GRU记忆模块保存此信息,使句子表示更加准确;在树结构网络中句子表示依赖于根节点的固定维度向量,为了不局限于此,本文在模型中添加注意机制,该模型综合树结构中所有节点表示获取句子表示,增强了模型的核心信息和句子特征表达,在句子情感分类的实验中表现突出。