【摘 要】
:
在自然语言处理领域,方面级情感分析(Aspect-based Sentiment Analysis,ABSA)是一项重要的细粒度研究任务,其被广泛应用在理解舆论、市场调研、品牌声誉分析、客户体验识别、评估社交媒体影响力等领域。它旨在分析一段文本或一句话中的多个方面所对应的情感极性。这一任务的主要挑战在于缺乏大量的带有针对方面级情感分析的标签数据,并且现有的运营商投诉文本实际数据存在噪声大、规律性不
【基金项目】
:
国家自然科学基金优秀青年基金:高维数据表示;
论文部分内容阅读
在自然语言处理领域,方面级情感分析(Aspect-based Sentiment Analysis,ABSA)是一项重要的细粒度研究任务,其被广泛应用在理解舆论、市场调研、品牌声誉分析、客户体验识别、评估社交媒体影响力等领域。它旨在分析一段文本或一句话中的多个方面所对应的情感极性。这一任务的主要挑战在于缺乏大量的带有针对方面级情感分析的标签数据,并且现有的运营商投诉文本实际数据存在噪声大、规律性不够强、方面词包含与重叠等问题。尽管相较于传统的方法,基于深度神经网络的方法能够提取到丰富的文本特征并提升该任务的完成效果。但是现有的大量方法未能准确捕获有效地上下文信息,不能充分利用方面词与其临近上下文的关联信息。然而在已有的大量工作中,将方面级情感分析分为两个阶段,即先进行方面词抽取,再判断特定方面的情感极性。其中,忽略了两项子任务之间的关系将导致误差传递,使模型对识别错误的方面词进一步地判断其情感极性,从而造成错误累计。因此方面词抽取与特定方面情感极性判断任务之间具有相互促进、辅助的关系,如何利用两项子任务之间的关联信息同时抽取方面词和判断其情感极性是一个具有挑战性的任务。考虑到多任务联合学习的方式会通过不同子任务的损失函数对模型参数进行优化,使得子任务之间能够相互影响。同时,基于局部上下文的聚焦机制能够很好地捕获方面词的语境信息。为了能够合理应对一句话多方面词或方面词的包含与重叠等情况,且使模型能更充分地适应运营商投诉对话的强领域性,本文提出一个基于运营商投诉文本预训练语言模型的跨度标注的端到端方面级情感分析模型,具体从以下两部分展开:(1)基于预训练语言模型BERT,本文首先提出了使用无标注运营商投诉数据对其基于遮掩语言模型预训练任务进行领域信息迁移预训练,应用探针任务验证运营商投诉领域信息迁移对于方面词抽取任务能够有效提升效果。本文使用探针试验分别探究了经过领域迁移的预训练语言模型对不同领域、方面词与非方面词所生成的隐表示,并择其部分样本使用降维方式用可视化的方法直观地展示了两种区分下的隐表示的分布情况。在这两种区分下,经过领域迁移的BERT所生成的隐表示都有着相对明显的子空间。此外,在此基础上本文使用基于跨度的标注方式对方面词进行抽取,通过与现在较为有效的几种基准方法进行对比,本文模型都获得了更加精准地识别出复杂文本中的方面词。(2)为了捕获方面词与其情感极性的关联信息,本文提出了使用多任务联合学习模型对运营商投诉文本进行端到端方面级情感分析的模型(BERTp-LCF-ATS EPC)。通过同时抽取方面词和判断相应的情感极性,多任务学习模型能够更好地利用方面词上下文与情感极性的关联信息。应用局部上下文焦点机制使方面词上下文表征与情感极性之间的细粒度交互,得到特定方面的情感极性判断。此外,本文采用基于跨度的标注方式以应对方面词相互包含与重叠、多方面词等问题。在投诉对话文本数据上的实验表明,BERTp-LCF-ATSEPC模型可以更加充分地捕获方面词和情感极性之间的关系,并相较当前先进的端到端方法进一步提升了运营商投诉对话中方面级情感分析的性能。
其他文献
应时代之需和国家战略发展安排,科学教育的发展与水平提升已经成为教育领域内的重中之重。而学前儿童科学教育是科学教育的祭奠阶段,寻求幼儿科学教育的优化方案更是亟待解决的关键问题。分析当下幼儿科学教育的主要困境,一方面在于对幼儿科学素养的了解缺失。基于此,另一方面,教师对于幼儿的“不解”与“误读”也使得教师难以给予幼儿及时有效的支持。“幼儿朴素概念”是解决这一困境的有效抓手。通过长期观察发现,幼儿在角色
由于传统能源的不可再生性,开发和利用可再生的清洁能源,对减少化石燃料的使用有着重要意义。氢气具有零碳含量的特点,能量密度较高,足以与石油媲美,被认为是一种无污染,可以满足未来可持续发展需求的替代燃料。通过水分解产生氢气有着重要的应用价值,这是因为水解制氢可以通过分子间的转化实现大量能量的储存,且不会产生温室气体和其他污染物。层状双氢氧化物(LDHs)被认为是一种很有潜力的水电解催化剂。经过调研,本
<正> 病例报告黄××男,49岁,已婚,江苏籍,泥工,1980年6月25日第5次入院。患者于1968年6月,因孩子手指患有肿瘤截除,妻多病,要求经济补助未遂,开始失眠,兴奋话多,又唱又跳,自言自语,于7月13日首次住院。诊断:“心因性反应”。经用氯丙嗪,
随着无人机技术的发展,无人机在众多领域得到了广泛的应用,同时也对无人机的功能与性能要求日益严苛,有诸多关键技术和共性技术需要解决,其中自主飞行控制就是最基础最重要的技术。根据无人机自主飞行控制任务的特性,本文选用深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)为基础算法进行研究,针对无人机长距离目标任务引起的状态空间剧增现象,解决无人机自主控制任
作为培养学生问题解决能力的全国中学生生物学联赛的情境化试题研究少,而PISA是基于真实生活情境的试题,能提高学生的问题解决能力,这与我国教育考试评价改革指向试题情境化,生物学新课标重视各种情境化资源进行试题命制来培养学生的问题解决能力不谋而合。本文以2017-2021年的CHSBO试题的情境化特点和命题策略为研究目的进行研究。首先通过文献研究法了解生物学情境化试题情境素材来源、命题基本原则、命题策
正太铁路自石家庄至太原,在法国人的主导下设计修筑。该路于1896年开始筹建,1904年开工修建,1907年建成通车,全长约243公里。通车后,正太铁路运营权及管理权均掌握在法国人手中。1933年,铁路借款还清,正太铁路收归国有。从正太铁路法占时期5座已消失的站房——石家庄站、太原府站、娘子关站、榆次县站、头泉站,4座现存的站房——阳泉站、南横口站、上安站和南张村站来看,正太铁路法占时期站房立面的分
在城市交通结构逐步向智慧化、绿色化转变的新形势下,共享单车作为环境友好型的出行方式,凭借其便捷、高效的服务优势,成为解决以轨道交通为骨干的公共交通系统“最后一公里”出行的重要手段。然而,其与城市轨道交通接驳场景的相关理论研究与实践经验仍有待深化,主要体现在接驳需求特征分析、出行行为及偏好研究、对交通系统环境影响,以及精细化运营管理等方面。基于此,本研究响应城市交通的绿色低碳发展要求,在对共享单车接
近年来,随着人工智能技术的发展,多智能体系统的分布式控制问题引起了广泛的讨论。相对于单智能体系统,多智能体系统具有较强的鲁棒性和抗干扰性,目前被广泛应用在智能机器人、复杂网络、人造卫星等领域。根据每个智能体是否可以具有独立的动力学方程将多智能体系统细分为同质和异质多智能体系统。对于异质多智能体系统,不同的智能体可以拥有不同的动力学模型甚至是不同的状态维数,更具有一般性。此外,多智能体之间的信息传输
社区是社会治理的基本单元,社区治理的成果关系社会的和谐稳定和群众的安居幸福,需要政府、居民、企事业单位、社会组织等多元主体协同配合,以达到高效有序的治理目标。网格化治理是近年来在基层社区治理实践中的重要举措,在数字化技术的支持下,网格化治理一方面有力提升了社区治理的效率,但同时也因其行政化属性,而挤压了其他治理主体作用发挥的空间,与基层自治之间形成了张力问题。基层治理体系的进一步优化与完善需要在网
在新时代背景下,党和国家对于加强国企党建不断加以重视,国有企业党建在党的建设中的角色与地位日益突出。国有企业党建工作水平,关系着国有企业经济发展的生命线,国有企业的党建工作是企业健康发展的政治保证。党对国有企业全面领导离不开国有企业党务工作者队伍建设这一重要环节,党建水平的高低,取决于基层党组织建设水平,也在很大程度上取决于党务工作者的水平。切实抓好党务工作者队伍建设,特别是基层一线党务工作者队伍