论文部分内容阅读
文本情感分析旨在利用信息技术挖掘文本背后所表达的情感与态度,是自然语言处理中重要的任务。情感分析能够分析文本背后对于商业商品、社会实践、机构、公共话题的看法与态度,有着重要的科研价值与社会价值。近年来,大规模预训练模型成为自然语言处理中的里程碑式创新,其能产生结合上下文的词表征,同时通过大规模无监督预训练存储了大量的语义知识。在情感分析相关的诸多任务中,大规模预训练模型均明显地提高了准确率,但仍然存在领域自适应、语法知识缺失、句子级文本表征不足等诸多问题。本文针对这些问题进行深入研究,提出了对应的创新性解决方案,论文的主要贡献如下:(1)基于大规模预训练模型的跨领域情感分析。大规模预训练模型是通过大量的、无标签的通用日常语言来预训练的,对于其他领域如文本评论数据领域具有领域知识差异。同时预训练模型也缺乏跨领域情感分析中所需的辨别领域知识的能力。为了解决这个问题,本工作提出了领域辨别预训练任务与情感增强预训练,通过无监督的后训练的过程,为大规模预训练模型融入领域感知与情感知识。结合对抗训练,本文的方法在多个数据集上取得研究当时一流水平。(2)基于图卷积神经网络的语法增强模型。细粒度情感分析要求对文本中的不同实体进行情感倾向性判断,很多情况下,同一句文本中含有多个目标实体,其对应的情感词也可能会有不同的极性。在这种情况下,语言的语法结构信息能够帮助模型定位实体所对应的情感词,具有重大意义。然而,现有的大规模预训练模型与预训练任务缺少对于语法知识的建模,为此,本工作提出了基于图卷积神经网络的语法增强模型,以字符作为节点,根据句法依存树转化成的邻接矩阵,为预训练模型引入了句法限制以及长距离依赖信息。除此之外,本文还设计了针对语法类型的门机制,实现了语法结构与类型的双感知。多个数据集上的实验表明本文方法达到了研究当时一流水平。(3)基于对比学习的句子级表征预训练。在现有的大规模预训练过程中,字符级别的预训练占主导地位,句子级别的预训练仅仅在语言连贯性层面,不足以生成具有内容辨别力的句子级特征。为了解决这一问题,本文根据用户点击的新闻文本数据,设计了用户行为协同规则,对于内容相似与不相似的正负样本,在句子级别上进行了对比学习预训练。特征可视化实验表明,经过大规模对比学习预训练后,预训练模型对于不同类型的新闻文本实现了很好的区分,产生了具有内容辨别力的句子表征。在新闻推荐任务中,本文提出的模型很好地对用户的新闻兴趣和情感倾向进行建模,达到了研究当时的一流水平。(4)基于胶囊网络的细粒度情感分析模型。细粒度情感分析旨在分析文本中不同实体目标的情感倾向,最大的挑战是多种不同情感倾向的实体目标混在同一句文本中,情感特征互相重叠与干扰。为了解决这一问题,本文引入了胶囊网络,通过向量化神经元输出以及聚类式的动态路由算法,实现了对于不同实体的情感特征的聚类。除此之外,本文为基于EM算法的动态路由过程引入了交叉注意力机制,构建了实体目标与主体文本之间的语义关系。多个数据集上的实验表明,我们的方法超过了基线模型,达到了研究当时的一流水平。