论文部分内容阅读
随着社交网络与电商平台的兴起与发展,越来越多的人乐于在线上发表有关于购物、旅游、服务等领域的评论,这些带有个人主观情感态度的文本十分具有挖掘价值。在情感分析领域,文档级和句子级的情感分析只能挖掘整体的情感极性信息,但无法分析用户对于文本中各个实体或属性的情感及意见,因此方面级情感分析应运而生,其中方面可为实体或属性。近几年深度学习的发展与广泛运用,也为方面级情感分析任务提供了新的解决方法。本文主要关注基于深度学习的方面级情感分析问题,针对该研究内容现存的一些问题,尝试提出高效的解决方案。首先,目前的方面级情感分类模型大都基于整个句子进行预测,而这会引入与方面情感无关的上下文噪音信息。针对这一问题,本文提出了一个基于强化学习的神经网络模型来自适应地抽取与方面相关的描述片段,并基于该片段完成后续的情感分类任务。实验结果表明,本文所提方法可以有效地提取描述该方面的片段,从而实现情感分类性能的提高。此外,通过案例分析,可以直观地解释为什么本文所提模型会适用于方面级情感分类。其次,针对目前的方面级情感分析模型在建模过程中没有很好地利用方面抽取、情感词抽取和方面级情感分类三个子任务之间的关系这一问题,本文提出了一个端到端的方面级情感分析模型。该模型不但可以学习到子任务之间的关系,互相促进,还能解决一个方面对应多个情感词和一个情感词对应多个方面的问题。最终,本文在三个英文标准数据集上进行实验来验证模型的有效性。实验结果表明,本文提出的模型能取得比现有模型更好的效果。最后,为了探究所提模型的应用性与泛化能力,本文开发了一个方面级情感分析系统。该系统包括在线Demo、应用展示和数据分析模块。通过在线Demo模块,用户能在线完成方面级情感分析;应用展示模块提供了评论分类的功能,可以帮助用户了解评论中各实体属性的特性,还可用于算法模型的样例研究;而数据分析模块可以快速完成方面、情感词、情感极性等分布信息的统计和可视化,这些信息能帮助用户更好地了解数据的分布情况以及使用者对于产品各个方面的意见。