论文部分内容阅读
文本情感分析是自然语言理解的重要研究方向之一。对话情感分析是文本情感分析的新兴研究领域,指在多轮对话的上下文中,分析每一句对话的情感。该研究可以更好的帮助机器理解现实世界交流,推动如数据挖掘、人机交互等多个领域的发展。文本的情感分析领域已经有了很多出色的研究成果,但是在对话情感分析领域,仍然有很多问题有待解决。本文主要针对以下几点问题进行研究探索:1)相同的对话文本在不同的上下文中会传达不同的情感;2)当对话轮数较多时,当前的研究并不能很好的获取对话间的信息交互;3)不同于传统的短文本或者文档的情感分类,对话场景下的情感数据库的规模一般较小;4)当前模型并没有考虑对话主体之间的信息交互,但是对话主体的信息在对话场景下的情感分析中是很重要的。为解决以上问题,本文提出了层次结构框架处理对话场景情感分析任务,即使用双层模型分别建模单句特征与句间信息交互。本文提出了基于此结构的两种模型:层次卷积神经网络模型,层次transformer 模型。层次卷积神经网络模型的主体结构分为两层:底层卷积神经网络模型用于建模语段中单词间的信息交互,从而获取单语段编码;上层注意力机制用于建模对话过程中不同语段之间的信息交互。通过对比实验我们验证了句间信息交互对于解决对话文本情感分析的必要性,此外,无论从实验结果的数据指标还是从可视化效果上来看,层次卷积神经网络模型都表现良好,证明了此模型的有效性。在此基础上,本文完善了层次卷积神经网络模型的数据输入源,并使用更加强大的特征提取模型transformer替换了层次卷积神经网络模型中的卷积神经网络和注意力机制,进而提出了层次transformer模型。此外针对数据库规模较小的问题,我们使用了预训练模型bert(Bidirectional Encoder Representation from Transformers)作为底层transformer的具体实现,这相当于引入了外部数据,在一定程度上缓解了数据库规模较小的问题。为解决对话主体间的信息交互问题,我们首次加入了对话主体编码,这使得我们的模型可以捕获对话主体间的信息交互。最后在三个标准数据集(Fr i ends、Emot ionPush、EmoryNLP)上,本文提出的层次transformer模型在macro-F1等指标上均表现优秀,证明了本文提出模型的有效性。最后基于本文所提出的模型,设计实现了对话场景情感分析系统,并完成了系统功能及性能测试。