基于深度学习的方面级情感分析研究

来源 :沈阳化工大学 | 被引量 : 0次 | 上传用户:f372286882
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本情感分析是自然语言处理领域当中的一个重要分支,是对实体表达的观点看法的一种研究。文本情感分析研究涵盖了文本挖掘、信息抽取、机器学习、信息检索等多个领域。近年来,随着科技的进步与互联网的快速发展,人们的购物方式发生了天翻地覆的变化,网上购物成为当今社会的一个新形态。电商平台为用户提供了一个可以进行在线评论的功能,来发表用户对商品或服务的评价。随着互联网的普及与电商平台的增多,导致平台上的评论文本数据激增并呈指数增长,如何能够高效、快速的在海量的评论文本中挖掘信息,现已成为国内外的研究热点。传统的文本情感分析在解决文本情感极性判断问题上有着良好的效果,但随着需求的增长,用户希望能够得到评价对象的特定属性的情感倾向分析。于是,基于方面级的细粒度情感分析被提了出来。本文针对现有方面级情感分析待需要解决的问题,结合了相关工作中主流的深度学习的文本情感分析技术的优势,提出了一种基于BERT(Bidirectional Encoder Representations from Transformers)预训练模型并融合了迭代膨胀卷积神经网络(Iterated Dilated Convolutional Neural Networks,IDCNN)和双向长短期记忆网络(Bi-directional Long Short-Term Memory,Bi LSTM)的方面级情感分类模型,在此基础上又提出了一种基于Stacking思想的方面级情感分类模型,并对所提模型在自构数据集上验证其有效性。本文完成的主要工作有:(1)针对现有方面级情感分析任务实验用数据集的不足,本文使用Python语言中的Requests模块,对京东商城的摄像头评论数据进行爬取,构建了一个摄像头在线评论数据集,用于验证本文所提方面级情感分类模型。(2)针对基于传统机器学习技术的文本特征提取不能解决一词多义问题,本文提出使用预训练模型—BERT。针对CNN存在的特征信息丢失的问题,提出采用迭代膨胀卷积网络进行特征提取。针对样本数据分类不均衡问题,提出采用Focal Loss函数来代替传统的交叉熵函数作为本模型的损失函数。为了验证模型的有效性,采用多种基准模型进行对比实验。实验结果表明,本文所提BERT-IDCNN-Bi LSTM模型在F1值性能指标上,较其他模型有一定提高。(3)针对BERT模型在提取文本特征的时候利用了并行的注意力机制,会使得模型丢失学习局部特征的不足,本文利用Stacking思想对LSTM、CNN和BERTIDCNN-Bi LSTM三种情感分类方法进行模型融合,并在本文自构建的数据集上进行了相应的实验验证,实验结果表明所提模型在F1值性能指标上,较其他模型有一定提高。
其他文献
目的:分析在治疗胆脂瘤型中耳炎患者中应用开放式鼓室成形术中自体骨粉行外耳道后壁重建的价值以及临床疗效。方法:随机挑选胆脂瘤型中耳炎患者100例并分成试验组与参照组。在开放式鼓室成形术的基础上,参照组采用耳甲腔成形术的治疗方法,试验组给予自体骨粉行外耳道后壁重建术进行治疗。结果:统计两个治疗小组的治疗总有效率,试验组要显著高于参照组(74.00%)。术后统计两个治疗小组外耳道结构正常率,试验组(94
甲状腺疾病是一种临床上常见的内分泌疾病,其病因机制复杂多样。目前关于甲状腺疾病的研究主要局限于临床上的药效评价,对其发病机制研究较少,因此甲状腺疾病动物模型的建立对分析该类疾病的病理机制以及提高临床疗效有着较为重要的意义,成功的实验动物模型不仅能降低实验成本,还具有可行性、重复性高等特点。本文就近年来关于甲状腺功能减退症、甲状腺功能亢进症、桥本甲状腺炎、甲状腺癌等甲状腺疾病动物模型的建立方法做一总
随着经济的快速发展,全国的车辆总数日益增长,车牌识别已经成为交通运输管理的关键性技术。基于传统的车牌识别算法已经可以应用于小区、停车场等这种简单场景;但是,在全天候复杂的工作环境下,车牌图像会存在模糊、受损、倾斜等情况,传统算法抗干扰能力差、模型不具有通用性,设计出来的算法定位和识别效果不理想。基于传统方法的局限性,本文提出基于深度学习的车牌识别算法。首先,本文提出基于改进U-Net的语义分割模型
脑机接口(Brain-Computer Interface,BCI)提供了一种不依赖周围神经和肌肉而直接与环境交互和控制外部设备的方法。它可以直接读取并将人脑中的生理电信号转换成控制信号从而控制外部设备。BCI在疾病识别、神经修复、神经反馈训练、利用脑波生成视觉图像、情感分类、军事、娱乐等领域得到了广泛的研究和应用。对运动想象脑电信号分类是脑机接口研究中的关键技术之一。本文以提高运动想象脑电信号的
寻求高效的节能方法是应对日益严重的能源问题的有效途径。而脉动热管作为一种结构简单、体积小、效率高、适应性强的新型传热元件,在强化传热、节能减排等各个领域应用日益广泛。目前对脉动热管的研究主要集中在实验以及数值模拟两方面,对管内工作流体的对流换热、导热以及相变等多种物理过程与脉动热管运行机理间的联系研究的不够透彻。为更加深入的研究脉动热管的工作机理,本文从管内工质的流动与传热以及流体动力学角度,建立
设计模式是经验化的文档,用于解决特定背景下反复出现的软件设计问题。由于设计模式封装的经验知识较专业且组织形式各不相同,随着设计模式不断地被提出,其表达的意图、应用的范围也越来越复杂。对于特定的软件设计问题,在没有工具的支持下,选择正确的设计模式去解决这些问题对于软件开发人员来说是十分具有挑战性的。已有的软件设计模式选择方法主要有以下几个问题:在设计模式数量较多时缺乏灵活性、对设计模式的搜索场景利用
高能物理中喷注识别任务是从背景中识别出特定的信号,这些信号对于在大型粒子对撞机上发现新的粒子或者新的过程都有重大意义,同时区别不同喷注结构的技术也推动了量子色动力学的发展,进一步提高了人们对高能粒子领域的理解。近年来随着神经网络和深度学习技术的日趋成熟,本文针对现有喷注分类模型存在的缺乏有效的特征提取手段、训练过程繁杂等问题,结合喷注数据的空间特性,将喷注视为三维空间中的点云数据,在此基础上提出了
板式换热器板片是板式换热器的核心部件,在冲压生产的过程中可能会产生微裂纹缺陷。板式换热器如果使用了存在微裂纹的板片,将具有泄漏的隐患。在工业生产中一旦原料出现泄漏,可能引发经济,环保等方面的问题。因此,板片生产后要进行严格的检测,保证存在缺陷的板片不会被投入使用。人工目测法和渗透探伤法是常用的微裂纹检测方法。人工目测法难以保证微裂纹检测的准确性;传统的渗透探伤法工艺繁杂,微裂纹检测的实时性较差。设
情感分析是人工智能领域中自然语言处理的重要研究方向之一,近年来备受国内外研究机构和相关人员的关注。情感分析包括面向文本、面向图片、面向视频、面向语音等各个方面。由于语音是人类最原始最直接的交流方式,包含着人类丰富的情感,所以语音的情感分析尤为重要。本文将婴儿哭声的情感分析作为研究背景,目的是找到可以对婴儿哭声的情感进行自动识别的智能模型。通过智能模型实现对婴儿身体健康状况、心理发展及精神状态做出准
圆形截面螺旋通道作为目前常见的曲线通道换热器,广泛应用于化工、航天等领域。本文采用射流冲击的方式强化了圆形截面螺旋通道内的流体流动与换热,基于计算流体动力学软件Fluent进行数值计算,并将数值分析结果与已有实验结果作对比,以验证本文数值模拟方法的准确性,分析射流参数与螺旋通道曲率对流动与换热的影响。本文探究了不同射流速比(εj)及入射角(α)作用下,不同曲率圆形截面螺旋通道内的涡旋结构、复合流场