【摘 要】
:
特定目标情感分类是自然语言处理的重要研究方向之一,其旨在准确判别句子中目标实体的情感极性,由于目标实体的情感极性依赖于句子上下文语境中某些表达目标情感的情感特征词,通过挖掘目标实体与句子上下文的语义情感联系,从而找到与目标实体相关的情感特征词;虽然特定目标情感分类模型在过去的几十年研究中已经有了极大的发展,但仍存在无法充分挖掘目标实体与情感特征词的关联,以及准确判别包含多个目标的句子中的目标情感极
论文部分内容阅读
特定目标情感分类是自然语言处理的重要研究方向之一,其旨在准确判别句子中目标实体的情感极性,由于目标实体的情感极性依赖于句子上下文语境中某些表达目标情感的情感特征词,通过挖掘目标实体与句子上下文的语义情感联系,从而找到与目标实体相关的情感特征词;虽然特定目标情感分类模型在过去的几十年研究中已经有了极大的发展,但仍存在无法充分挖掘目标实体与情感特征词的关联,以及准确判别包含多个目标的句子中的目标情感极性等一系列问题,所以依旧是一个极具挑战性的任务。为了准确判别句子中目标实体的情感极性,本文通过研究当前自然语言处理领域的方法,提出基于深度学习的特定目标情感分类模型,主要内容为:(1)提出基于目标特征融合的图卷积网络模型(Aspect-feature Fusion with Graph Convolutional Network,AFGCN),该方法首先将句子输入至词嵌入层、Bi-LSTM层中进行上下文语义编码,得到句子的隐层向量表示;然后根据句子中词,离目标实体的不同距离,分别对词的隐层向量表示乘上相应的位置权重,从而达到距离较远的词其影响也越小的效果;由于目标作为一个实体名词,其情感倾向由句子中的情感特征词决定,其本身并不包含情感倾向,所以先将目标置为零向量,再使用图卷积网络,将与目标存在依存句法关系的词的隐层向量表示,填充至目标隐层向量中;然后再使用注意力机制在句子隐层向量表示中筛选关键信息,最后再与池化后的目标隐层向量拼接得到最后的结果。通过融合图卷积网络和注意力机制筛选出的关键信息,构建了更为准确的情感特征表示,从而提高了分类精度。(2)提出基于多目标依存建模的图卷积网络模型(model Multi-aspect Dependencies with Graph Convolutional Network,MDGCN),模型首先对输入句子进行语义编码,再通过注意力机制对目标进行上下文语义编码;为了能够有效建模同一句子中多个目标之间存在的依存关系,提出根据句子的依存句法树构建多目标依存图,再根据多目标依存图使用图卷积网络对多个目标之间的依存性进行建模;最后,利用生成的目标表示进行情感分类。通过构建多目标依存图,获取了目标之间的依存关系,弥补了单一目标受限于句法依存树上的关联词而无法找到更有效的情感特征词的局限性,从而提高了分类精度。(3)在AFGCN网络模型的基础上,本文联合预训练语言模型以及对依存句法树进行改进,提出基于改进依存句法树与预训练语言模型的图卷积网络模型(AFGCN over Improved Dependency Tree and BERT,IBGCN),首先根据句子的依存句法树,以目标为中心,重新设计面向目标的依存句法树(Aspect-oriented Dependency Tree,ADT),针对每个目标生成其特有的依存句法树,从而充分利用了目标的特征,然后,为了增强模型的表达能力,同时拥有句子在特定语境下不同隐层表示的词向量,使用BERT作为词向量,使句子中每个词在高维空间中有更加准确且符合语境的隐层表示,从而提高了分类精度。
其他文献
迁移学习是通过利用源域的已标记数据中的知识来增强目标域中的模型性能,而目标域中只包含少量或没有标记的训练样本。因为在现实世界中人工标记数据需要耗费大量的人力和物力,所以利用已标记源域来辅助目标域任务可以大大减少人工标记的消耗。目前,主流的迁移方法假设源域和目标域包含相同的特征空间,而实际应用中收集具有相同特征空间的源域和目标域比较困难。因此,异构迁移学习的发展解决了这些局限性。异构迁移学习中源域和
控制器的性能优劣不仅决定控制系统能否达到期望目标,而且也直接影响整个工业过程的稳定与安全。当前,各类工业企业的计算机控制系统逐步完善,这给存储大量控制系统运行数据提供了条件。这些数据中包含着与设备特征、过程动态、系统工况以及控制器性能等相关的各类信息。如何充分利用这些数据,实现对在运行控制器的性能优化一直是过程控制领域的研究热点之一。课题针对实际中应用最广泛的PID控制器,研究基于数据驱动的不同结
高通量技术的发展使得生物数据呈指数级增长,生物数据的分析需求也随之日益增长。生物数据通过构建网络,根据网络结构对网络进行搜索、比对和聚类能够发掘网络中的隐藏信息,这对于生命科学的研究具有重要意义。蛋白质作为一切生命的物质基础,参与了生命过程的各个环节,分析不同物种的蛋白质相互作用网络,对于理解蛋白质功能、物种进化关系和疾病机理等具有重要意义。虽然目前蛋白质相互作用网络可用于许多物种,但许多物种中的
面对日益严峻的生态危机和环境挑战,生态环境损害民事法律责任作为环境法律责任体系的重要组成部分,其建立和完善对于我国加快生态文明体制改革、解决生态环境难题具有重要意义。经相关概念辨析,生态环境损害民事法律责任是针对行为人造成的生态环境自身损害所应当承担的以民事法律责任形式呈现的不利负担,其理论基础包括公共信托理论、污染者付费原则等。基于环境侵权制度难以适用、行政执法救济效果不佳、刑事责任难以实现生态
随着世界贸易自由化程度的加深,各国为了在贸易市场中占据一席之地,往往为了经济的发展而牺牲环境利益。目前,面对贸易中的环境纠纷,WTO协议和多边环境协定显得软弱无力,自贸协定因其设立的实质性环保条款以及环境争端解决程序取得处理贸易与环境纠纷的优势。通过对我国自贸协定中的环保条款的梳理以及对我国和域外自贸协定中环保条款的比较研究发现,我国自贸协定中实体性的环保条款存在着内容措辞模糊,条款分布零散以及具
随着人工智能技术不断发展,传统的医疗卫生体系与人工智能技术的融合,形成现在深入人心的智慧医疗。智慧医疗具有快速准确的诊断病情特点,在诊疗类似癫痫病这种常见的脑病疾病的中发挥着重要的作用。癫痫病是由于患者大脑的异常放电所引起的,在患者的脑电信号图中表现为出现尖波、慢波、棘波、等多种癫痫病的特征波形。智慧医疗利用信号识别以及机器学习等先进技术对受试者脑电信号中所反馈的生物信息进行识别分析,并给出诊断结
非婚同居现象在我国已经显露出不断攀升的发展趋势,非婚同居人数的增长,同居关系持续时间的增加,使得非婚同居者渐渐成为了一个新兴的群体。我国传统道德观念认为,家庭法中唯一合法存在的两性结合形式是婚姻,其他结合形式都是不符合家庭本质的,但随着两性关系的多元化,家庭结合形式的多样化,不管从法理的角度还是社会实践的角度,非婚同居关系都被证实是符合时代发展趋势,具有构建制度的正当性基础。我国家庭伦理道德的转变
随着数字化技术的飞速发展,生活方式和教育理念正在发生转变。许多国家、地区和国际组织迫切的需要21世纪人才,纷纷致力于人才的培养,并提出了不同的21世纪能力框架,其中,协作能力是所有框架中都提到的21世纪人才所必备的能力之一。协作学习作为以学为主的学习形式的典型代表,被认为是一种有利于培养学生高级认知目标和协作能力的新型教学模式,受到了越来越多研究者和学者的持续关注。如今,有关协作学习的研究已经日臻
随着深度学习的高速发展,越来越多的跨领域学科正在相互结合以便更有效的解决存在的问题,利用深度学习方法的医学影像技术在医学诊断中有着不可或缺的作用。其中医学图像分割作为医学影像技术的一个重要研究方向,对病理分析、临床诊断和后期手术方案的制订起着重要意义。其中人体腹部CT影像是腹部器官疾病的诊断依据,而肝脏作为腹部最大的器官,对人类的生命健康起了至关重要的作用,肝脏功能的异常与很多疾病有着密切的联系,
近年来,“平面设计”的命名变更为“视觉传达设计”,意味着学科的发展不局限于视觉的形式和承载的媒介,转向更注重传达本身。这是由于在信息爆炸时代下信息传播的渠道和方式发生了变化,传统视觉识别已经逐渐难以满足大众的生理和心理需求。这需要设计师积极探索新的视觉识别形式,而科学技术的进步也为视觉识别设计的革新制造了机会,将其推向了创新驱动、技术助力的新局面。生成艺术是通过计算机代码生成艺术作品的创作形式,它