【摘 要】
:
随着互联网的迅速发展,情感分析已经成为自然语言处理的研究重点。语义提取和情感分类是解决这一问题的关键途径。面对不断变化的文本表达方式,现有算法的表现不令人满意。要想获得准确的情感分析结果,需要关注文本高层情感语义,需要提取文本多模态语义特征,需要提升情感分类的效果。论文重点研究了文本情感分析中的上述关键科学问题。论文主要工作和创新点如下:为了解决已有的语义提取算法提取结果不完善的问题,本文提出基于
论文部分内容阅读
随着互联网的迅速发展,情感分析已经成为自然语言处理的研究重点。语义提取和情感分类是解决这一问题的关键途径。面对不断变化的文本表达方式,现有算法的表现不令人满意。要想获得准确的情感分析结果,需要关注文本高层情感语义,需要提取文本多模态语义特征,需要提升情感分类的效果。论文重点研究了文本情感分析中的上述关键科学问题。论文主要工作和创新点如下:为了解决已有的语义提取算法提取结果不完善的问题,本文提出基于强化学习的情感语义提取算法,强化学习模型能够识别简单文本的复杂情感特征,提取情感语义。其中,多模态语义提取模型可以充分提取文本多模态特征,情感注意力加强机制通过有效跟踪和反馈情感分析结果,指导优化多模态语义提取模型的语义特征提取算法,通用的扩展词典能够对影响情感类别的内容给予更高关注。为了解决已有的情感分类算法准确度不高的问题,本文提出了基于改进深度学习模型的情感分类算法,改进深度学习模型能够分析文本语义中的长期和短期依赖关系,得到文本情感类别。其中,语义提取模型将文本转化为词嵌入向量,长期情感分类模型分析文本的长期依赖关系,短期情感分类模型关注文本的局部特征信息并分析文本的短期依赖关系,最终输出准确的情感分类结果。为了在复杂的文本数据中充分发挥情感语义特征的价值,本文提出了基于强化学习和改进深度学习模型的情感分析算法。在协同训练方法的作用下,基于强化学习的情感语义提取模型有效地理解文本情感信息。基于改进深度学习模型的情感分类模型进行充分地情感分类,并将分类结果反馈给情感注意力加强机制,优化语义提取算法,从而提升文本情感分析的性能。
其他文献
类不平衡数据指的是在类别上有偏斜的数据,近年来类不平衡数据的处理已成为统计研究的一个热点。现实生活中许多数据往往都呈现出高度不平衡的特性,如何提高类不平衡数据中的分类性能是我们亟需解决的问题。通常地,传统的分类算法是以数据集平衡状态为前提的,它们对于平衡数据或均匀分布的数据其分类效果良好,但是对类不平衡数据的分类表现出较差的效果。为了解决该问题,本文从再平衡的角度对类不平衡数据展开研究,以期来提高
空间技术以及成像技术在近些年得到了持续地更新和发展,高光谱遥感的分辨率不断地得到提高,但与此同时也给高光谱图像的特征提取带来了不小的挑战。传统的高光谱图像特征提取方法关心的仅仅是频谱信息,往往不能结合空间邻域信息,因此提取到的特征效果不佳,而近些年来,基于深度学习的方法得到了广泛的应用,因为它能够同时提取到高光谱图像的空间特征和频谱特征。然而大多数基于深度学习的特征提取方法都是有监督的,有监督的特
近年来,各产品或服务供应商纷纷利用电商平台积聚的巨大流量开展各类营销活动,二者之间的合作一般采取平台代理模式。在这一模式下,平台提供服务并抽取一部分销售额作为佣金,而供应商拥有产品的定价和库存等决策权。然而渠道间溢出效应的存在带来了新挑战,尤其在产品迭代更新速度加快、需求波动性极大的市场环境下。因此,本文搭建了存在溢出效应和需求不确定性的平台代理模型,以研究溢出效应对平台和供应商决策的影响。本研究
从2008年开始,上交所与深交所强制要求全部上市公司采用XBRL标准进行年报披露,学术界因此展开了对XBRL财务报告实施效果的研究。众多学者发现XBRL实施对会计信息质量提升有很积极的作用,但是鲜有人从会计信息外的角度进行研究,本文则从高管薪酬契约视角研究XBRL的实施效果。本文选取高管薪酬业绩敏感度作为具体研究对象,首先验证验证薪酬业绩敏感度存在。接下来,通过对沪深两市样本的回归分析,发现XBR
近年来,载频和波达方向(DOA)联合估计成为阵列信号处理的热点问题。但是随着阵列信号处理技术的发展,对参数估计精度的要求正不断提高,为增加阵列结构的估计精度,最为直接有效的方法就是提高天线数量,但这将导致阵列接收系统的硬件实现成本增加,且现有信号处理接收机采样数据量庞大,使得后续信号处理算法处理数据量越来越多,同样增加了阵列接收系统的实现难度。为了解决该问题,目前存在两个方面的研究:其一为稀疏阵列
动物对其生境的响应是跨尺度的,多尺度分析可以为理解物种的生态格局和生态过程提供重要的理论启示,同时也可以为管理者依据不同尺度制定相应的保护策略提供有效方案,因而对物种保护与管理具有重要意义。水鸟是表征湿地生态系统健康程度的重要指示生物,但其多尺度的栖息地选择机制却鲜少被研究。本研究以东亚水鸟的重要停歇地东北平原为研究区域,对两种种群数量日益减少的水禽——白额雁(Anser Albifrons)和豆
在对空间目标的观测过程中,光波的传播受到随时间变化的大气湍流的随机干扰,使地面望远镜观测到的图像像质退化。为此,现代的大视场自适应光学系统多利用多颗导引星对一定视场内的湍流进行采样。由于大气湍流随时间在不断变化,其随不同高度分布的廓线也会发生时变,因此本论文结合实时变化的大气湍流廓线计算导引星的最优位置对进一步提高自适应光学系统性能至关重要。本文提出采用简化的近地层自适应光学几何模型作为系统性能评
阅读作为一种重要的信息输入方式,在英语学习中有着不可替代的作用。为了找到一种更加有效的英语阅读方式,国内外许多研究者致力于阅读教学模式的研究。Rumelhart在1977年提出了交互阅读模式,它结合了自上而下阅读模式和自下而上阅读模式。近年来,交互式阅读模式已经成为许多语言学家和教育工作者的研究热点。本文以初中生为研究对象,旨在验证交互式阅读模式是否在提高初中生阅读兴趣和阅读成绩方面有效。本研究选
随着中国的快速发展以及汉学热的再一次风靡世界,西方汉学家对于《易经》的研究再次掀起了一股热潮。然而由于《易经》译本的留存方式多为拉丁文版本,缺少法语译本,所以作为《易经》研究必不可少的一个环节,系统研究《易经》的法译存在其深远的意义。本文从分析汉学家Charles de Harlez的译本LE YI-JING:TEXTE PRIMITIF RéTABLI,TRADUIT ET COMMENTé入手
对于离散事件系统,给定一个关于状态的秘密集合,若入侵者不能推断出系统的当前状态是否属于该秘密集合,那么认为系统具有不透明性。在以网络形式存在的信息物理系统中通常系统本身也会引入插入函数等方法来加强自身的不透明性,而这种加强不透明性的方式主要表现为对输出序列的再编码。再者,离散事件系统中也存在很多不可观测事件,这将导致入侵者可能不可以准确地推断出系统当前状态,站在入侵者立场,这样的问题显然需要及时解