基于深度学习的方面级情感分析算法研究

来源 :福州大学 | 被引量 : 0次 | 上传用户:jl88106
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感分析是指挖掘和分析评论文本中情感信息的过程。方面级情感分析是情感分析的子任务,旨在预测评论目标的具体方面所对应的情感极性。本文主要针对现有的方面级情感分析模型存在的方面信息丢失、无法利用句法依存关系等问题开展研究,主要研究内容如下:记忆网络虽然能够有效地长期存储文本中的信息,但是无法充分利用评论文本中的远距离语义依赖关系,导致语义信息丢失,进而影响情感极性的预测。同时,在注意力权重的计算过程中,还存在方面信息丢失的问题。针对上述问题,本文提出了一种融合分层多头注意力机制的记忆网络模型(Memory Network with Hierarchical Multi-head Attention,MNHMA)。首先,为了提取上下文中的长期依赖关系,提出使用一种基于双向旋转记忆单元的语义信息提取策略。其次,提出一种分层多头注意力机制来保存方面信息,使MNHMA能够集中注意力于文本中给定方面的上下文关键词。最后,在分层多头注意力层的每个注意力层中使用具有非线性激活函数的全连接层,以模拟情感的非线性转换,从而获得能够更精确反映给定方面相关情感信息的上下文表征向量。实验结果表明,本文所提MNHMA模型能够有效提高方面级情感分析性能。与记忆网络和循环神经网络相比,图神经网络的优势在于能够利用评论文本单词之间的句法依存关系从而提升模型学习给定方面相关情感信息的能力。但是现有基于图神经网络的模型仅对句子建模,并没有对句中的给定方面单独建模以充分利用方面信息。而且,现有基于图神经网络的模型所采用的注意力机制过于简单,容易受到噪声词的干扰,从而导致模型无法有效提取上下文中的关键情感信息。针对上述问题,本文提出了一种融合多粒度注意力机制的图卷积网络模型(Graph Convolutinal Network with Multi-grained Attention,GCNMA)。GCNMA通过两个双向长短期记忆网络分别学习句子和方面的向量表示,然后利用多层图卷积网络对句子向量进行更新。同时,提出了能够实现单词级注意力和句子级注意力的多粒度注意力机制。该机制结合两个双向长短期记忆网络的输出和多层图卷积网络的输出以捕获方面和上下文单词之间的依赖关系,从而生成句子的最终表征向量。实验结果表明,GCNMA能够准确预测给定方面的情感极性,模型性能优于目前最先进的方面级情感分析模型。
其他文献
随着人工智能的大力发展,图像智能技术被普遍运用于我们日常生活和工作中,而图像智能应用是强依赖于输入的图像质量,图像去噪经过移除图像噪声能够有效地提高图像质量。本文对传统的基于非局部自相似性图像去噪算法和基于卷积神经网络去噪算法展开研究,主要的研究内容如下:(1)图像去噪算法中基于非局部自相似性的算法存在不足之处:在全局匹配相似图像块矩阵的时候并非所有的图像块都能匹配到相似图像块,对于细小纹理图像块
学位
能从文本中自动创建一个或多个文本文档的简明摘要,该技术以最小化冗余率,且最精简的语言提炼文本信息为目标,使用户能够在巨大的信息资源中获得重点,提升阅读效率。现有的文本摘要模型可分为抽取式文本摘要模型与生成式文本摘要模型。抽取式文本摘要模型对原文中句子的重要性建模,选择能够代表原文中心含义的句子作为摘要。而生成式文本摘要模型按照原文中表述的语义,由语言生成技术自动生成文本的摘要。得益于近几年来深度学
学位
逆光车牌图像修复是智慧交通领域中具有挑战性的研究问题之一。受太阳光反射的影响,车牌识别系统所采集到的车牌图像被光斑遮挡,造成车牌信息丢失,使得车牌识别系统的识别准确率下降。因此,逆光车牌图像修复的研究将有助于车牌识别技术的实际应用推广。与传统的计算机视觉方法相比,深度学习技术具有处理复杂模式的强大能力。目前,车牌识别系统大多是使用多设备或者通过控制拍摄条件进行多图像的采集,进而筛选出无逆光或逆光影
学位
网络虚假评论检测研究旨在从海量互联网评论数据中识别水军发布的虚假评论,是自然语言处理领域的重点研究课题之一。现有方法主要利用文本特征和用户行为信息实现虚假评论检测,取得了较大的进展,但仍存在诸多挑战如:以往的方法在文本特征提取过程中,难以关注到文本中的关键词语义信息;现有的模型存在训练效率低且分类精度不足的问题;已有的方法未考虑水军评论的群体共性特征,导致模型性能受限。针对以上问题,本文进行了如下
学位
随着立体电视、头戴式立体显示器等硬件技术的风靡,虚拟现实、增强现实等立体内容受到人们的广泛青睐。然而立体显示技术的普及也暴露出一些问题,很多人在长时间观看立体内容时出现眼疲劳、头痛、对焦困难、恶心等生理症状。立体内容质量欠佳是造成上述不良症状的重要原因之一,因此通过立体图像舒适度增强技术提高立体图像质量以及提高用户体验是重要的研究课题。在立体内容制作环节,使用专业的立体摄像机设备和规范的拍摄手段可
学位
当前热点的深度隐写术可以把图像秘密信息隐藏到尺寸相同的载体图像中,具有隐写率高等特性,常被特定组织用作秘密通信。主动隐写分析术能够去除所隐藏的秘密信息,一定程度阻止深度隐写信息通过互联网进行非法或恶意传输。文档图像具有大量的文字信息,其作为深度隐写秘密信息能够在秘密通信中传递大量有效信息,具有泄漏机密信息的安全隐患,然而目前并没有相关研究专门针对文档图像作为秘密信息的深度隐写去除方法,于是本文提出
学位
近年来,深度神经网络在图像识别领域取得了巨大的成功。然而研究发现,深度神经网络极易受到对抗样本的欺骗。攻击者仅通过在图片上添加微小的、人眼不可见的扰动,就可以让深度神经网络对该图片做出错误分类,从而达成一些非法的目的。因此,研究对抗样本防御算法对于保障深度神经网络在实际应用中的安全十分重要。针对对抗样本的防御问题,本文主要研究工作如下:(1)对抗攻击方法性能评估。首先,本文提出从对抗样本的图像质量
学位
随着集成电路的制造工艺步入纳米时代,芯片中的元件越来越多,使得布线的难度越来越高。因此,布线已成为超大规模集成电路物理设计中最亟待解决的问题之一。通常,布线分为全局布线和详细布线两个阶段。全局布线作为布线的第一阶段,上承详细布局,下启详细布线。一个高效的全局布线算法能把拥塞信息反馈给布局器,让布局器能摆放出高可布线性的布局方案。另一方面,一个高性能的全局布线算法能有效地满足设计规范,让详细布线的负
学位
近年来,随着移动互联网的蓬勃发展以及智能手机的快速普及,Android应用的数量飞速增长。应用内功能众多,这些功能不仅能满足应用使用者的需求,还能被进一步发布成API用于外部调用。例如,第三方应用使用微信的分享API发布朋友圈。但是将应用功能封装为API的过程较为繁琐,传统的API封装方式是针对指定的功能模块,通过代码重构发布其API,这种方式不但会增加开发者的工作量,而且难以应用于第三方应用的A
学位
随着计算机技术、多媒体技术以及网络通讯技术的快速发展,数字图像处理的相关技术被广泛地应用于人类社会生活的各个方面。视觉是人类获取外界信息的主要途径之一。在现实场景中,受限于图像传输带宽和存储成本等影响,在传输、存储过程中往往不能将图像完整的保存下来,需要对图像进行不同程度的压缩,进而导致所获图像质量受到影响。特别地,近几年随着移动互联网的快速发展,越来越多的用户在移动设备上观看图像,受限于移动设备
学位