【摘 要】
:
近年来,互联网大数据发展十分迅速,自媒体平台和各类在线购物网站上均出现了大量的带有用户情感的在线评论。这些评论文本数据蕴含着大量的情感信息,不仅可以帮助商户挖掘出用户对商品或服务的情感倾向,还可以作为商品性能与质量提升的依据。文本情感分析是自然语言处理领域里一项重要的研究课题,具有广泛的应用前景。文本情感分析按粒度属性可分为篇章级、句子级和方面级三类。与篇章级和句子级别情感分析任务相比,方面级情感
论文部分内容阅读
近年来,互联网大数据发展十分迅速,自媒体平台和各类在线购物网站上均出现了大量的带有用户情感的在线评论。这些评论文本数据蕴含着大量的情感信息,不仅可以帮助商户挖掘出用户对商品或服务的情感倾向,还可以作为商品性能与质量提升的依据。文本情感分析是自然语言处理领域里一项重要的研究课题,具有广泛的应用前景。文本情感分析按粒度属性可分为篇章级、句子级和方面级三类。与篇章级和句子级别情感分析任务相比,方面级情感分析任务具有更加细粒度的信息,一般体现为用户对商品的某一方面做出的情感评价。这些评价信息可以为商户指明更为细致的商品性能提升与服务推送的方向和思路。因此,方面级情感分析任务具有更高的研究价值和商业价值。方面级情感分析任务是判断输入文本中给定方面的情感极性,目前常见的方法为使用神经网络对输入句子进行编码,并提取方面词与上下文情感词关系,根据相关情感词得出评论针对特定方面的情感判断。但是大多数已有模型只注意到句子中单词之间的上下文位置关系,导致长距离非临近的词的匹配效果不理想,且忽略了句子的语法结构,无法体现文本语法结构特点。另外,解决方面级情感分析问题的方法多利用神经网络,其本身会存在对训练标记数据的质量和数量上的依赖问题,在缺乏训练数据或标注不够理想时,神经网络会往往表现不理想,甚至不够健壮和稳定。基于以上背景和问题,本文提出结合数据增强与图神经网络进行方面级情感分析。本文主要研究内容如下:(1)本文提出了结合对抗训练与关系图注意网络模型(RGAT-BAT)用于方面级情感分析。关系图注意网络具有多层体系结构,每一层都使用近邻的特征编码和更新图中节点的表示。在语义语法树结构上利用关系图注意网络,可以有效地利用句子语法信息和单词依赖。在利用语法信息的基础上,集成依赖标签本身的信息,可更准确地捕捉单词之间的关系,有效地解决长距离非临近的词的匹配问题。对抗训练属于数据增强技术的一种,可以在模型训练中动态地从以前标记的数据创建新的训练数据,且能够通过扰动神经网络的手段训练,提高对恶意样本的抵抗能力,增强神经网络的健壮性与稳定性。同时,对抗训练也是一种正则化方法,可以解决过拟合问题,提升模型泛化能力。(2)本文提出结合Mixup与关系图注意网络的模型(RGAT-Mixup)。使用Mixup技术结合关系图注意网络进行方面级文本情感分析。Mixup技术是数据增强方法中扩展较小数据集的有效工具,其可用于匹配深度学习模型所需的标记数据量,在有限数据量情况下提升模型性能。采用Mixup结合关系图注意网络有助于减少模型开发的成本,解决标记数据数量不足的问题,同时可保证模型性能。本文提出的模型,在Sem Eval 2014-Task4 Restaurant、Sem Eval 2014-Task4Laptop和Twitter评论数据集中进行了实验验证。实验结果表明,本文的方法可有效地提高方面级情感判断的准确性和神经网络的稳定性。
其他文献
表没食子儿茶素没食子酸酯(Epigallocatechin gallate,EGCG)是茶叶中具有抗癌症,抗心脑血管疾病,抗氧化等生物活性且含量最高的儿茶素类化合物,其可减少骨骼肌萎缩,促进肌细胞分化;支链氨基酸(Branched chain amino acids,BCAA)作为人体的必需氨基酸具有提升蛋白质合成率,调节肌肉量等作用,在调节细胞能量吸收,抑制自由基形成,使成肌细胞免于饥饿死亡等方
沉水植物是维系浅水湖泊生态系统健康的核心生态组分,异龙湖为典型的高原浅水湖泊,已有研究显示异龙湖近10年里发生了明显的沉水植物消亡与恢复现象,其中2009年沉水植物大面积消亡、2013年又明显恢复,导致异龙湖沉水植物在短期内显著变化的原因尚未有明确的结论。为探讨影响异龙湖沉水植物生长消亡的关键驱动因子,并为异龙湖沉水植物管理提供依据,本研究以异龙湖为研究对象,收集获得了近25年的总磷、总氮,水深、
在图像配准与融合、全景图拼接、基于内容的图像检索、目标检测与追踪、三维重建等一系列计算机视觉应用中,特征匹配是一项基础和重要的环节,其目的是在包含相同或相似场景的两幅图像之间建立可靠的特征对应关系。由于成像视点改变、拍摄时间改变或传感器类型不同等原因,图像通常会出现变形、遮挡、重复纹理、多模态等特征匹配难点。现有的方法通常基于估计底层图像变换从一组假定匹配中去除错误匹配。满足预定义变换模型的匹配则
图像深度估计是机器人导航、自动驾驶和无人机飞行等应用的基础支撑。单目深度估计是指从单幅二维图像中获取每个像素点的深度值。然而从单幅图像中获得深度信息是一个病态问题,近年来随着深度学习在图像领域不断突破,使用深度学习方法获得图像的深度信息成为了一个主流研究方向。基于深度学习的单目深度估计是指输入RGB图像,利用深度神经网络提取图像特征,输出一张深度图。将输入数据转化成另一种输出数据,很难直接用一个过
茶树生长易受光照、土壤及温湿度等环境因素的影响,因而茶叶品质在不同的种植条件下也具有明显差异。其中,海拔高度对茶叶品质的影响较为显著,随着海拔的升高,昼夜温差大,有机物质逐步富集,同时,一些含氮物质和芳香物质含量也逐步增加,形成了品质相对更为优质的茶叶。目前,尽管海拔对茶叶品质影响的相关研究较多,但其对不同加工工艺和不同等级高山绿茶的影响却鲜有报道。为深入研究海拔对高山绿茶品质的影响,本文选取海拔
政府间气候变化专门委员会第六次评估报告已指出近20年来全球平均表面温度上升0.99℃。湖泊作为水生生态学的重要组成部分也有所表征,其湖泊表面水温(Lake Surface Water Temperature,LSWT)整体呈上升趋势。湖泊表面水温作为湖泊生态学最重要的指标之一,既影响湖泊中的生物物理化学过程,也影响湖泊所在流域及其周边环境,而人类活动与湖泊的变化息息相关,因此对湖泊表面水温的研究可
采后甘薯在贮藏过程中因呼吸所产生的二氧化碳(Carbon dioxide,CO2)积聚而常常发生高CO2伤害,造成严重的经济损失。解偶联蛋白(Uncoupling protein,UCP)参与调控植物对多种生物、非生物胁迫的应激响应,但未见UCPs调控采后甘薯对CO2胁迫的响应机制研究。本研究首先在甘薯全基因数据库中筛选甘薯UCP基因家族成员并进行克隆和生物信息学分析,研究其应答非生物胁迫的响应模
颜色信息作为立体图像中的重要特征,左右眼视图的颜色不对称可导致观看立体图像时的视觉不舒适。本文开展颜色不对称立体图像的视觉舒适度主客观评价实验,研究眼动数据中瞳孔直径变化、注视持续时间、眼跳发生次数、平均眨眼持续时间以及平均眨眼次数与颜色不对称立体图像视觉舒适度间的相关性,试图给出使用眼动数据来对立体显示视觉舒适度进行客观评价的方法。实验中,刺激选取6幅经过CIELAB颜色空间转换的具有9个不同色
灰葡萄孢(Botrytis cinerea)可在番茄、草莓、黄瓜和葡萄等超过1 400种植物上引起灰霉病,是农业生产和贮藏过程中的重要真菌病害。由于化学杀菌剂的抗性、残留和再增猖獗等问题,开发新型高效的植物源杀菌剂,是当前灰霉病防治的研究热点。植物精油已被证实具有广谱的抑菌活性,结合其低毒、对环境友好的特点,引发了学者的广泛关注。本论文以B.cinerea为研究对象,测定了9种精油对B.ciner
中国共产党自诞生以来,宣传工作始终作为党的事业的重要组成部分,服务于党的成立、成长、发展和壮大全过程。党的宣传工作运用自身手段和独特优势,为无产阶级和广大民众服务,为社会主义事业服务,为实现党的奋斗目标和革命理想提供有力支持。正是拥有丰富的实践过程,才让它不断总结实践中的经验与教训,完善了宣传工作的传统和作风,逐渐确立了颇具特色的工作原则和业务规范,形成了自己的思想和理论体系。胡乔木曾是一位我们党