基于自注意力机制的目标情感分析算法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:fliedpig
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于目标的情感分析是一种细粒度的情感分析研究,是自然语言处理领域的热门方向。研究目的在于从海量互联网文本中挖掘出细粒度元素,产品、服务、事件等目标及其观点和情感,包括目标提取、意见提取、特定目标的情感分析三个子任务。只解决其中一个子任务的研究,需要假定其它任务的结果已经给出,然而实际应用中没有完美的模型给定结果,从而存在误差传播和局限性。实际场景中的目标通常不是给定的,不仅需要自动提取出目标,也需要预测其情感极性,甚至需要提取出对应的观点意见。因此,同时解决其中两个或三个子任务能获取到更具应用价值的细粒度元素。本文围绕目标提取和情感预测、目标情感三元组提取两个任务展开,提高基于目标的情感分析算法的准确性、完整性。目标提取和情感预测,旨在同时处理目标提取和特定目标的情感分析两个子任务,识别文本中的目标对象及其情感极性。目标情感三元组提取,完整解决了三个子任务,提取出目标、意见、情感三元组。基于目标的情感分析研究中,目标提取和情感预测、目标情感三元组提取工作主要存在两方面不足:一方面,子任务之间具有依赖关系,模型没有充分利用子任务信息,同时学习不同类型的子任务存在困难。另一方面,大多数研究采用长短期记忆网络、单层自注意力机制等技术提取特征信息,无法捕获输入文本的复杂内部关系。针对以上不足,本文分别对目标提取和情感预测、目标情感三元组提取开展研究,具体工作如下:1)解决目标提取和情感预测任务:现有研究工作无法充分利用子任务信息协助目标和情感的同时生成,此外,普遍基于长短期记忆网络,无法抓捕输入句子的内部关系用于情感分析预测。为了解决以上问题,本文提出一种基于双辅助网络的目标提取和情感预测模型。设计双辅助网络增强目标提取和情感识别能力,缓解模型同时学习两种不同子任务的困难。更进一步地,通过引入方向感知Transformer提取特征,有效对齐多个目标对象和情感词的内在关联。模型在三个公开数据集上进行实验,对比基准模型有显著的效果提升。2)解决目标情感三元组提取任务:现有主流研究方式侧重序列标签设计,模型同时产生目标、意见、情感极性时,没有充分利用子任务信息。此外,它们普遍采用单层自注意力机制,其学习句子中词语之间联系的能力较弱,无法学习到多任务复杂性导致的输入句子中词语间的复杂多面关系。为了解决以上问题,本文提出基于两阶段学习的目标情感三元组提取模型。两阶段学习机制增强模型对目标对象和意见术语的提取能力,为预测情感极性提供指导信息,有助于目标、意见和情感的同时生成。更进一步,通过引入Transformer网络学习输入句子中词语间的复杂联系。模型在四个公开数据集上对比基准模型,效果有一定提升。
其他文献
随着社会的发展和时代的进步,互联网技术给人们的生活提供了极大的便利。尤其是近些年来,大量的社交媒体平台兴起。不仅为人们的交流提供了便利,也改变了人类获取信息和传播信息的方式。在社交媒体平台上,人们可以自由的创造、发布和提取热点信息。许多人也利用它的时效性散布和传播谣言,博取网民们的眼球,吸引人们的关注,从而谋取利益。谣言被定义为没有事实根据的消息,它往往会误导读者。它不仅会伤害到个人、社会甚至整个
学位
在现代电力系统向高比例电力电子化发展过程中,宽频带下的谐波谐振问题日益引起关注。这些谐波谐振问题会带来严重危害,轻则影响供电系统的电能质量,重则引发谐波谐振事故,损毁供电系统设备,严重威胁供电系统的安全稳定运行。无论是单相供电系统还是三相供电系统,系统固有的阻抗频率特性既是刻画谐波谐振问题的关键指标之一,也是制定谐波谐振抑制方法的重要依据,但是阻抗频率特性仅仅依靠建模和仿真计算的方法难以准确获得。
学位
伴随全球化产业深层次变化的发生,机械臂技术为多领域多产业提供了有力支撑。当前,机械臂在实际作业场景下仍面临环境复杂多变、目标模型未知,自主感知交互能力不足带来的严峻挑战。因此,本文以七自由度机械臂作为研究对象,围绕未知多变的机械臂应用场景,以机械臂抓取问题作为研究主线,融合机器视觉与深度学习方法深入探索机械臂抓取位姿检测问题,同时针对机械臂路径规划问题展开分析研究,旨在为复杂未知环境中的机械臂自主
学位
现在市场中的企业都不是孤立运营的,而是处于整个供应链上,所以对于核心企业来说,供应链上的供应商的配合程度在日常业务运营方面很重要。在供应商管理整个流程中,供应商的选择是很重要的一环,直接决定了合作供应商的质量以及后续的合作关系,也是现在市场竞争中的重点,但是,现在公司在供应商选择的过程中还存在很多的问题。基于此,本文以A公司为研究对象,对供应商的选择进行优化研究,主要的研究内容如下:(1)现状分析
学位
针对阿尔兹海默症的计算机辅助诊断近年来得到了极大的发展,但是已有的大多数该类研究都是使用监督学习的方法来展开的。但医学图像的标注需要标注者具有对应的医学知识,从而导致带标签的医学图像数据比较稀缺,进而影响了该领域研究的进展。虽然该方面的带标签数据较少,但是在实际中有大量的无标签数据由于没有标签而没有被有效利用。因此,如何使用这些无标签数据去提高阿尔兹海默症病灶分割和分类的性能是本文拟解决的问题。同
学位
电子医疗数据是患者生理/心理的病情记录,亦或是人体日常健康监测数据,在疾病治疗与病理研究中充当着相当重要的角色;同时,作为隐私数据,如何实现其安全共享成为研究的热点。目前,医疗数据主要以中心化存储的形式,通过公有云或私有云集中存储在医疗机构服务器中。在此主流方式下,医疗数据共享系统一旦遭受攻击可能导致单点故障,患者无法对自身医疗隐私数据进行访问控制,更无法对分散的医疗数据进行安全共享。因此,本文立
学位
随着医学信息化程度不断增加,产生了大量的医学文本数据,通过信息挖掘与分析,从非结构化的数据中抽取三元组成为重要的研究方向。传统的中文医学文本的实体关系抽取方法存在词组分割歧义、信息缺失和关系重叠等问题,本文通过词组信息嵌入和指针标注框架,融合自注意力机制,提出一个融合词汇增强的基于注意力机制的指针标注模型,以此来解决中文医学文本关系抽取中存在的问题,提升关系抽取的性能。本文的主要研究内容如下:在嵌
学位
随着全球贸易化的不断深入,汽贸企业面临着诸多新局面和新问题,一方面,是愈演愈烈的中美贸易战以及欧洲多国的“双反”政策,导致汽贸企业面临的市场环境愈加严峻。另一方面,“构建国内大循环为主体、国内外双循环、国内外双循环相互促进的发展新格局”的重大战略部署,也为汽车贸易企业的发展带来了良好机遇。作为国内汽车贸易行业的领头羊,庞大汽车贸易集团如何在诸多机遇和风险面前突破自身局限,有效实现企业发展的战略目标
学位
经典的推荐系统着重于推荐的准确性,随着用户多样化需求的增加,推荐结果的多样性受到越来越多的关注。推荐的精度与多样性存在冲突,传统的推荐算法往往也忽略系统中的用户活跃度差异。因此,本文从数据分布的特点着手,提出面向不同用户的层次化推荐模型,该模型以快速非支配排序遗传算法NSGA-II(Fast Non-dominated Sorting Genetic Algorithm)为多目标进化算法载体,以推
学位
充气膜作为一种自重轻、透光性好、外形美观的结构形式,近年来被广泛运用于水立方等大跨结构,以及航空航天可展开结构中。气枕结构是充气膜结构的一种,气枕结构由内充气体和外部膜材组合而成,内充气体为气枕提供结构刚度,因此如何考虑气枕的内充气体,对气枕的力学性能有着重要的影响;外部膜材是为气枕提供预应力并维持气枕构形的主要构件,由于薄膜的抗弯刚度较小,受到压应力作用会发生局部屈曲,产生褶皱变形,影响气枕结构
学位