【摘 要】
:
情感分析(Sentiment analysis)是自然语言处理的重要领域之一,其目的是从各种数据源中收集基于特定主题的主观意见或感受。但是情感分析在带有复合情感的句子中可能无法准确分析出不同方面情感倾向。因此更具细粒度的情感分析任务,方面级的情感分析(Aspect-based sentiment analysis)被提出,这个任务旨在识别出被分析主体涉及到的多个方面的情感倾向。方面情感分析由多个子
【基金项目】
:
广东省促进经济高质量发展专项资金项目,《广东省新兴海洋经济产业地图与大数据平台》,项目编号:GDNRC[2020]056;
论文部分内容阅读
情感分析(Sentiment analysis)是自然语言处理的重要领域之一,其目的是从各种数据源中收集基于特定主题的主观意见或感受。但是情感分析在带有复合情感的句子中可能无法准确分析出不同方面情感倾向。因此更具细粒度的情感分析任务,方面级的情感分析(Aspect-based sentiment analysis)被提出,这个任务旨在识别出被分析主体涉及到的多个方面的情感倾向。方面情感分析由多个子任务组成,包括方面词抽取、观点词抽取、方面情感分类与情感极性分析等。方面词抽取任务与观点词抽取任务是方面情感分析的两个子任务,已经有许多工作在这两个子任务中得到了进展,但是这两个子任务经常被独立考虑,忽略了方面词与观点词之间语义是紧密相关的。针对该问题本文在现有算法的研究基础上,提出将两个子任务视为一个整体,并为其实现一个多任务框架,让两个子任务能更好的完成信息的抽取,主要的研究内容包括以下三点:1)针对静态词向量无法根据具体语句进行调整的局限性,本文提出使用BERT预训练模型作为模型的词嵌入层。BERT提供动态词向量,可以根据数据集的不同动态调整词向量,调整后的词向量能更好的表达语义信息,从而提升抽取任务的准确率。2)将方面词抽取任务获取的方面词信息作为观点词抽取任务的输入,提升观点词抽取任务性能。并对现有面向目标的观点词抽取任务模型的特征抽取层进行改进。3)提出使用管道模型与联合模型将方面词抽取任务与观点词抽取任务结合,搭建一个多任务框架。联合模型中多个任务共享词嵌入层,使多个任务能通过词嵌入层进行信息交互,这种结构可以有效减少上游模型预测错误导致的错误传播,进而提升下游模型的抽取能力。本文在方面词抽取与观点词抽取两个子任务上,通过联系两个相关模块以及对现有模型提出优化方案,并通过实验证明了使用多任务框架将相关模块结合,能让模型效果得到提升。
其他文献
颅内压高症是许多疾病的共有症群,采用植入式设备对患者的颅内压进行连续性监测,并在监测到颅内压异常时自主释放降压药物以维持患者颅内压动态平衡,这对颅内压高症的治疗具有重要意义。本文围绕植入式颅内压监测给药系统进行研究,设计并实现了具有颅内压监测、颅内压异常诊断和药物释放的功能植入式系统。(1)针对传统颅内压监测设备不灵活,患者依从性低的问题,设计了一种软植入的颅内压实时监测设备,在允许患者小范围活动
纳米孔已经成为一类特殊的单分子分析工具,为检测和表征核酸和蛋白质等生物分子提供了巨大的潜力。作为生物纳米孔的替代品,固态纳米孔由于其在孔隙几何和孔径尺寸上的大范围可调性以及其优异的机械特性和电学特性而呈现出显著的多功能性。本文采用离子电流监测机制辅助的各项异性湿法刻蚀法进行锥形硅基固态纳米孔的制备,在满足低成本、批量化、可控性制备需求的同时,将制备工艺节点推进至亚5nm。围绕上述主题,本文主要研究
随着互联网信息科技的发展,人们在日常生活需要处理各式各样的信息,信息过载成为人们快速获取需要的信息内容的一个重大难题。推荐系统的出现无论是对于业务需要的高效工作,还是日常生活的品质体验,都帮助人们大大减轻了筛选信息的工作,带来巨大的帮助和收益。推荐系统的实现方法是根据学习用户或项目本身的属性信息,以及用户与项目的历史交互信息来挖掘用户可能感兴趣的项目。但传统的推荐算法只关注于用户和项目的直接交互数
社交媒体中存在着大量的用户情感信息,企业决策者们不仅希望了解用户情感,还希望了解相应的原因,以帮助他们从用户层面思考和优化产品。在这样的需求下,情感原因检测成为自然语言处理中具有重要价值和应用前景的任务之一,并逐渐发展为情感原因对提取任务(ECPE)。传统的二阶段ECPE模型存在着模型错误传递无法修正的问题,尽管后来的端到端模型解决了这一问题,但仍存在着文档事件特征利用不充分、混淆因子夹杂的问题。
命名实体识别作为自然语言处理领域中的基本任务,可以从非结构化的文本数据中提取实体信息,在问答系统、信息抽取、阅读理解等其他自然语言处理领域任务起重要支撑作用。在文本数据爆炸式增加、GPU计算能力快速提升的背景下,深度学习被应用于解决命名实体识别问题并取得了良好的效果,成为解决该领域问题的主流方案。虽然命名实体识别技术取得了迅猛发展,但许多命名实体识别研究都是在英文领域,中文领域的命名实体识别依然存
组合设备是一种高度自动化集成制造系统,能够对单枚晶圆进行高效且精确的加工。因此,它被广泛应用于半导体芯片制造。组合设备由一对真空锁、一个传输模块以及若干个加工模块组合在一真空环境中。随着半导体芯片制程日益复杂,由若干台组合设备通过缓冲模块耦合而成的多组合设备逐渐被晶圆厂采用。由于组合设备的价格不菲,因此寻找有效的调度与控制方法提高其利用率和回报率,是非常有必要的。近几年来,芯片产品种类多样化,晶圆
随着信息技术推动全球由传统工业进入信息社会,农业也迈入数字化、智能化的新时代。研究基于三维点云技术的植物形状表达与表型分析,对促进农业的高产量、高质量生产具有至关重要的意义。然而,对植物幼苗进行三维重建,常存在户外环境光线不稳定、叶片间的遮挡、摄像头视野限制、扫描精度过低等因素导致植物幼苗点云出现噪声、稀疏、缺失的情况,影响了植物表型分析的准确度。因此,研究植株点云数据的修补算法,能辅助植物三维形
随着互联网的发展,信息量指数增长,如何从大量信息中获取所需要的信息是一个重要问题,因此,信息抽取的相关技术研究愈发重要。事件检测是自然语言处理中事件抽取任务的子任务,是信息抽取中的一个重要方向。给定一段文本,事件检测旨在从中检测出潜在的事件类型。目前的事件检测主流是对文本中的触发词进行识别,并判断该触发词属于哪个事件类型。这种基于触发词的事件检测方式会加大数据标注的工作开销,此外,在事件检测任务中
故障诊断是设备维护中的关键部分,轴承作为现代机械设备中的基础元件更是维护过程中的关键部分。由于滚动轴承受各种复杂因素的影响,使之成为整个旋转机械系统中可靠性最差的零部件之一。传统的轴承故障诊断方法以人工设计降噪、滤波、特征提取为主,手动提取特征的过程相对繁琐,且需要一定的背景知识,在面对海量数据集时越来越力不能及。此外,轴承工作周期跨度大,工况复杂多变,这也使得手动提取特征愈发困难。随着深度学习的
随着硬件计算能力提升与众多深度学习方法的普及,行为识别算法逐渐应用于现实中。基于骨骼的行为识别算法是行为识别领域下的一个热门研究领域,吸引了不少研究人员的目光。众所周知,相对于深度学习方法,传统方法可以在较少样本情况下较快地进行训练与预测,但是准确率有所不足;而深度学习方法可以得到较高的准确率,但是需要较多样本用以训练并且计算量较大。这启发我们将传统方法与深度学习方法进行结合,使传统方法与深度学习