基于深度学习的层次化文本情感分类研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:bodden
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的快速普及和各种舆论平台源源不断的出现,人们逐渐在这些网络平台发表言论和倾诉情感,因此产生了海量的网络评论文本,这些文本蕴藏着丰富的信息,如何挖掘文本信息的价值赋能也随之成为了研究热点。自然语言处理领域的文本情感分析正是挖掘海量文本价值的一种技术,其中基于深度学习技术的文本情感分析是目前研究的热点。尽管目前基于深度学习技术的文本情感分析模型不断涌现并被广泛应用,但是依然存在很多技术点可以改进,例如:静态词嵌入技术存在词语语义表示不充分和不能解决多义词的问题,随后动态词嵌入技术的出现虽然能解决静态词嵌入方法存在的问题和获得较好的文本量化表示,但还需探究如何进一步利用这些表示以更好的完成相关任务;从人类语言特性看,一个文本的情感倾向是由文本中某些特定词语决定的,或者一个句子有多个方面词,每个方面词都有与之相呼应的情感词,因此需要设计一种模型,使其能偏向关注到文本的重要词语和过滤无关的信息;再者是目前主流的时间序列模型LSTM网络存在着计算复杂度高和不能并行化训练的问题,因此就需要寻找一种时间序列模型,它不仅能适应任务需求,还能较好的提取语义信息和有更少的计算复杂度;为了解决以上问题和获得进一步的整体性能提升,本文的主要工作和创新点如下:(1)使用功能类似LSTM网络的简单循环单元(Simple Recurrent Unit,SRU)的时间序列模型,它不仅有类似LSTM网络的融合语义编码的能力,还能并行化计算,有效的减少了计算复杂度和训练时间,且契合了下游的注意力机制计算。(2)使用了注意力机制,对每个词语进行注意力权重计算,这很符合人类语言特点,一个句子整体情感倾向或句子里某个方面的情感倾向很大程度决定于某些词语,利用注意力机制更准确地重构文本的时序信息,降低对文本情感分析造成性能上的损失。(3)为进行句子级情感分析和方面级情感分析任务,提出了BERT-Bi SRU-AT和BERT-Bi SRU-AMM两个文本情感分析层次化模型来完成任务。通过在各种公开数据集上的实验,实验表明了两个模型的有效性,模型能够获得更高的准确率,验证了动态词嵌入技术、双向简单循环模型和注意力机制的引入能有效的提高模型的整体性能。
其他文献
目的:探讨翻转课堂护理带教对产科胎心监护操作技能的影响。方法:选取2018年至2022年入职产科的新护士为研究对象,在胎心监护操作技能培训中使用翻转课堂护理带教模式,共计50人次。比较翻转课堂护理带教前后新护士的胎心监护知识、操作技能考核评分、对教学模式的认可程度以及学习能力变化。结果:翻转课堂护理带教后,新护士在胎心监护知识、操作技能考核评分高于带教前,学习能力评分高于带教前,差异均有统计学意义
期刊
在传统的图像分类问题中,训练一个模型需要依赖大量完备的标注数据。然而,随着现实世界的数据量不断增长,对数据进行人工标注变成了一项极其繁琐冗杂的工作。零样本学习可以有效缓解上述问题,具体而言,零样本学习可以在没有不可见类图像或视觉特征作为训练输入的情况下,利用有限的语义信息,对不可见类图像进行预测分类。因此,研究零样本学习可以使得算法、模型减少对图像类标签的依赖,减少人工标注数据的时间成本,极大地提
学位
时序行为数据广泛存在于各类应用系统中。如何挖掘时序行为数据中有意义的行为模式,捕捉用户潜在需求,进而提出更好的预测、推荐或运营策略受到了研究者们的广泛关注。本文提出的面向时序行为的潜在状态学习方法致力于实现离散稀疏行为数据的特征表达,在此基础上对用户的潜在状态及其复杂的时序依赖关系进行建模和学习,从而实现更好的时序推荐。然而,时序行为的状态建模和表征学习主要面临着以下三个挑战:(1)用户真实的行为
学位
基于观测数据发现变量背后的因果关系是许多学科所研究的重要问题。其中,事件序列作为一种重要的数据类型,是由连续时间域上的离散事件组成,常以各种行为记录,系统日志,异常告警等形式出现在经济、社会科学、通讯系统等应用场景中。基于事件序列发现不同事件类型之间的因果关系,能够帮助人们进行生成机制分析,根因定位,事件预测等研究。然而基于多变量事件序列数据,发现事件类型之间的因果关系是一项具有挑战性的任务。一方
学位
随着计算能力的提升和控制技术的进步,无人机被越来越广泛地应用于工业生产和日常生活中。路径规划是无人机领域的核心问题之一,多目标监视是路径规划的一个重要应用。群体智能是智能计算的一种,有收敛速度快、计算成本低、优化能力强等优势,在函数优化、旅行商问题、有依赖的优化问题和作业调度等问题上有广泛的应用。将群体智能算法应用于多目标监视的路径规划,有利于提升无人机的路径规划能力,从而提高无人机工作效率,节约
学位
时代在发展,教育也在不断变革。近年来,国家不断发布文件推动教育信息化,微课作为教育信息化的产物,取得了丰硕的发展成果。经分析发现,微课在化学复习领域应用研究较少。2019年新版高中教材发布至今,有关“物质的量”微课研究甚少,而“物质的量”内容是高一学生学习的难点。因此本文以“物质的量”为例研究系列化复习型微课的应用,以期找到有效的复习方法,解决学生复习困境,培养学生良好的自主学习习惯;找到有效的复
学位
越来越多的证据表明,长链非编码RNA(lncRNAs)与多种疾病密切相关。识别有意义的lncRNA与疾病的关联将有助于我们更好地理解这些疾病的分子机制。然而,由于传统生物实验漫长的实验流程和高额的实验成本等原因,使用传统的生物学实验只能推断出有限数量的lncRNA-疾病关联对。因此,开发推断潜在疾病lncRNA关联的计算方法,不仅可以减少研究的时间和成本来为生物实验提供方向,而且可以在lncRNA
学位
随着气候变化、环境问题的进一步加深,当前的能源消耗趋势得到了越来越多的关注,其中建筑部门相关活动的能源消耗占到全球终端能耗的三分之一以上,随着发展中国家的城市化推进,预计未来一段时间全球建筑能源年消耗量仍将持续增长,为了实现2060年“碳中和”的目标,需要一系列节能措施提高建筑的能源效率,而准确可靠的建筑能耗预测是这些节能措施的最重要一环,它不仅是评估节能措施节能潜力的重要工具,也是智慧建筑的重要
学位
孪生支持向量机(Twin Support Vector Machine,TWSVM)作为一种经典的二分类支持向量机模型,随着机器学习技术的发展,被不断改进。孪生支持向量机的设计目的是为了提高执行效率。孪生支持向量机解决二分类问题是通过求解两个二次规划问题,得出两个不平行超平面。每个超平面都靠近一个类的数据点,并且远离其它类的数据点。为了进一步提高执行效率,有学者提出了最小二乘孪生支持向量机。将孪生
学位
心理健康素养的培养是初中教育教学的目标内容之一,也是素质教育的必然要求。开展心理健康教育对中学生学习和生活发挥着重要作用。本文通过分析中学生心理健康教育的必要性,进一步剖析了教学中存在的问题,针对现行中学心理健康教育教学模式滞后、不适应网络社会环境,且教师不重视心理健康教育、存在认知偏差、未认识到个别学生的心理问题等现状,提出了家校共育搭建课堂+实践+网络互动的教育平台,同时端正教育认知并兼顾全体
期刊