融合位置信息与注意力机制的方面级情感分析研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:carjitar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的快速发展和5G时代的到来,每天都有大量的用户在微博,Twitter和淘宝等平台上对于某个事件或者某些产品发表评论。然而,传统的情感分析方法的对象通常是整篇文章、段落或者句子。这类方法在信息多元化的今天已经不能满足对具体事物进行情感分析的实际需求。方面级情感分析能够实现对评论文本中的不同方面进行情感极性判断,它可以为政府、企业、消费者提供全面且科学的决策依据,因此受到了广泛的关注。方面级情感分析的方法通常建立在深度学习的模型之上,尤其是循环神经网络,因为这类深度学习模型可以更加丰富地表达文本信息。但是在已有的方法中仍然存在一些问题。第一,在上下文编码阶段没有充分利用上下文相对于方面词的位置关系信息,这可能会导致对上下文的语义表示不够丰富。第二,在对方面词进行文本表示时,采用平均池化的方式忽略了方面词中各个单词之间的内部联系,可能会导致语义丢失或者语义错误等问题。第三,忽略了上下文与方面词之间的相互关系,部分工作虽然考虑了这种相互关系,但是它采用整体编码的方式来挖掘这种关系,在一定程度上会造成信息丢失。针对这三个问题,本文提出一个融合位置信息和注意力网络的情感分析模型(Sentiment analysis model combining position information and attention network,PAN),在PAN模型中设计了三个模块分别来解决这三个问题,本文的工作主要有以下几方面:1、在PAN模型中设计位置权重模块来丰富上下文的文本表示。通过在上下文的隐层信息中嵌入位置权重模块,为距离方面词相对较近的单词分配更大的权重,为距离方面词比较远的单词分配较小的权重。2、在PAN模型中用自注意力机制模块对方面词单独进行编码来使得方面词的表达更能突出中心词的含义。当方面词中的单词个数大于一时,我们通过自注意力机制计算每个单词的权重,以此来更新方面词的表示。3、在PAN模型中提出双边层次注意力网络(Bi-hierarchical attention network,BHAN)模块,充分利用方面词与上下文之间的联系。将上下文分为方面词左侧和右侧两部分,实现了从更细粒度的角度利用注意力矩阵来更新左右两侧上下文和方面词的文本表示的目的,为情感分类任务提供更多的有效信息。4、本文在公开数据集Sem Eval-2014 Task 4和ACL 14 Twitter上将提出的PAN模型与多个现有的情感分析方法进行对比实验。实验结果表明本文提出的PAN模型达到了更高的准确率。同时,我们也设置了消融实验验证了PAN模型中的位置权重模块、自注意力机制模块和双边层次注意力网络模块的有效性。
其他文献
研究背景:动脉粥样硬化(Atherosclerosis,AS)是一种由动脉血管内脂质积聚引起的慢性炎症性疾病,巨噬细胞是参与其进展的主要免疫细胞。巨噬细胞通过清道夫受体摄取氧化低密度脂蛋白(oxidized low-density lipoprotein,ox-LDL),胆固醇酯化反应将ox-LDL转化为游离胆固醇(Free Cholesterol,FC),胆固醇外排反应将FC排出。当巨噬细胞内脂
目的:观察行玻璃体切割手术的不同年龄段(40岁及以下或40岁以上)增殖性糖尿病性视网膜病变(proliferative diabetic retinopathy,PDR)患者的临床特点。方法:收集2018年1月至2020年9月于我院眼科中心由同一医疗组收治、同一术者手术治疗的PDR患者的临床资料。详细收集病史及全身资料,并予以玻璃体切割手术治疗,术后定期门诊随访患者,收集视力改善情况、有无术后并发
目的:Ras相关结构域家族1A(Ras-associated domain family 1A,RASSF1A)基因是肿瘤抑制基因(tumor suppressor genes,TSG)之一。在卵巢癌发展过程中,TSG的异常甲基化是极其重要的表观遗传沉默机制。RASSF1A基因启动子甲基化与卵巢癌(ovarian cancer,OC)的发生和发展关联密切。目前,在很多研究的样本量小、检测方法不统一
辣椒素(Capsaicin)类物质是辣椒胎座中合成的重要次生代谢产物,是评价辣椒果实品质性状的重要指标,在医疗、食品、农业、军事等领域都发挥这重要的作用,但在市场上,辣椒素常出现供小于求的情况,主要原因在于辣椒素产量太低,受限于环境条件、生产成本,传统育种方式很难培育出高辣味高产量的新品种,因此在分子层面,通过研究辣椒素合成机制,挖掘影响辣椒素含量的关键基因,找寻提高辣椒素积累的方法在该领域的研究
"玩事"是数字化人力资源管理时代的文化沟通工具,它把一个非常"软"的内容,即企业文化,借助于具体的勋章和金豆等做法构成的体系,做得非常实在。它的理念是:解决好人的因素,则开展工作任务更顺畅,更有利于达成工作目标。2018年4月,时任用友网络科技股份有限公司首席技术官、"玩事"项目创始人程操红先生,应邀来到清华经管学院MBA课堂,对用友企业文化落地互联网工具——"玩事"进行了主题分享:
期刊
随着信息时代的发展,互联网带给人们生活便利的同时,也产生了海量的数据。在数据爆发式增长的趋势下,如何处理海量的非结构化数据,抽取有效信息成了当下最为重要的问题。而命名实体识别技术可以从海量文本数据中提取关键实体信息。因此,命名实体识别任务起着至关重要的作用,具有极高的应用价值与研究意义。近年来,随着计算机硬件条件的提升,GPU的发展十分迅猛。在充足的算力面前,深度学习的应用越来越广泛。在没有计算能
分类是机器学习领域常见的问题之一,多标签学习是传统分类问题的变体,它能够处理每个实例同时和多个标签相关联的问题。目前已经存在大量成熟的方法用于解决多标签学习,这些方法整体可以被划分成两类:问题转换方法和算法自适应方法。问题转换方法通常会先将多标签学习问题转换成其他类型的问题,比如二元分类、多分类等,然后再利用相应的算法进行处理;而算法自适应方法则通过改变现有的算法来实现直接处理多标签学习问题。另外
研究目的:通过系统评价的方法来分析不同治疗方式对子宫内膜癌术后局部复发率的影响,以期为临床治疗提供循证学方面的证据。研究方法:通过计算机检索Pubmed、Cochrane、Web of science、Medline、重庆维普中文期刊全文数据库(VIP)、万方数据库、中国期刊全文数据库(CNKI)等中外文各大数据库中研究不同治疗方式与子宫内膜癌术后局部复发关系的相关文献。检索语种为中文和英文,检索
针对目前赤铁矿阴离子反浮选工艺所存在的问题,开发出了药剂制度及流程简单、可常温浮选的赤铁矿柱式阳离子反浮选工艺。该工艺的特点一是引入了以高效回收微细粒矿物为特点的新型浮选柱—微泡逆流接触式浮选柱;二是工艺流程中引入一种新型阳离子捕收剂GE-609,GE-609具有高效起泡性、耐低温、选择性好的优点。以该工艺中的微泡逆流接触式浮选柱为研究对象,对其捕集区的气泡行为特性进行深入研究。首先在自行设计的浮
随着医学影像学的快速发展,医生显著提高了对不同疾病的检测效率和诊断精度。其中,医学图像病灶区域的分割结果是医生作为临床学诊断的重要依据。因此,各种医疗图像分割技术涌现出来,极大地帮助医生提高医学诊断的效率和准确性。然而,医学图像具有高度复杂性、噪声分布不均匀以及不同医学研究部位差异较大等问题,传统的图像分割方法不足以很好地克服这些挑战。近年来,得益于数据规模的快速增长以及计算力的飞速提高,深度学习