基于深度学习的端到端方面级情感分析算法研究及应用

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:isc70279
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的快速发展,各种社交平台和电商平台也应运而生,极大地拓宽了人们的言论空间,产生了带有情感倾向的海量文本数据。对这些文本数据进行情感分析,对社会和商业等领域有重要意义。方面级情感分析旨在识别一句话中不同目标实体的不同情感倾向,具有重要研究价值。论文首先利用集成标注策略,将实体标签与情感极性标签融合,将方面级情感分析任务定义为序列标注任务,实现端到端的方面级情感分析;针对端到端模型中缺乏文本间交互信息学习的问题,在Bi LSTM-CRF框架基础上引入多头注意力机制,利用多头注意力构造不同子空间加强模型对句子内部结构的学习,增强模型聚焦不同语义信息的能力。其次,为了加强目标实体识别与情感分析任务之间的依赖关系,提出基于注意力机制的层次双向长短期记忆网络模型(Att-HLSTM),利用残差连接方式建立层次神经网络,使底层的目标实体边界预测结果作用于上层神经网络学习,添加门机制进行情感一致性优化。此外,目前中文方面级情感分析任务研究不足,中文复杂的语言特点制约了中文情感分析任务的发展。论文在实验中添加中文数据集,分别对英文和中文进行实验。针对中文字词特点,提出基于词边界的词汇增强方法,将潜在词语信息与字词位置信息进行规则整合,通过提高模型输入表示的信息量提升模型效果。最后基于论文提出的模型,设计并实现一个方面级情感分析系统,完成对在线电商中文评论的目标实体识别及情感倾向判断,证明了利用集成标注策略的端到端模型的有效性,为进一步挖掘消费者评论的信息价值提供了帮助。实验结果表明Att-HLSTM模型在中英文数据集上相较于基线模型均取得了最优效果,英文数据集的F1值分别达到了58.19%、68.70%,中文数据集F1值达到了66.16%,使用论文提出的词汇增强表示方法相较于基线模型F1值得到了4%的提升。
其他文献
心血管结构包括主动脉循环和心肌微循环,实现对它们的高分辨率、无创成像是当前临床亟待解决的技术难题。超声具有对活体心血管结构进行无创、可靠、高分辨率成像的潜在应用。对此,本课题前期已搭建了超声成像系统,在此基础上,本文为该成像系统设计了超声超谐波合成孔径聚焦成像算法,使该成像系统具有对心血管结构进行无创、高分辨率成像的可行性,相关的研究内容主要包括以下四个部分:首先,对高分辨率、高对比度超声成像方式
学位
半导体气体传感器具有灵敏度高和检测对象广的特点,但高温制备、高温工作使其难以实现低功耗和集成化需求。随着微电子技术迅猛发展,硅基MEMS微热板技术成为解决半导体气体传感器微型化和低功耗的有效途径。基于传统气敏厚膜浆料的半导体气体传感器在高温下会影响MEMS微热板的热稳定性,而胶体量子点作为一种“准零维”无机半导体纳米晶,可实现低温制备、低温工作,且其表面效应、量子限域效应以及可溶液加工的特性使其具
学位
随着存储器平面尺寸微缩技术逐渐逼近物理极限,摩尔定律放缓,基于相变存储器(PCRAM)的三维堆叠技术--3D XPoint存储器便引起了广泛关注。其兼具快速IO访问、高吞吐量以及非易失性等优异性能,是存储技术历史上的重大突破。但其相关技术尚不成熟,为实现大规模量产化,提高市场竞争力,仍面临着在制造成本、工艺复杂度以及器件结构上的严峻挑战。现有的基于水平电极堆叠的3D XPoint存储器未解决多维堆
学位
飞秒激光是目前在微纳加工领域可使用的最短脉冲激光,它具有的超高的瞬时功率、超短脉冲使其可以进行冷加工,超高精度使其可以加工微纳级别的样品,在物理学、生物学、化学控制反应、光通讯、医学等领域都有不可替代的作用。而二氧化锡是一种重要的半导体材料,在气敏、催化等方面具有众多优异的特性。本文将从仿真模拟和实验验证两个方面研究飞秒激光直写二氧化锡微纳结构:一、通过理论和仿真模拟来分析飞秒激光直写二氧化锡的过
学位
随着激光加工市场需求的不断提高,激光加工需要解决一些不易定位的非规则特征点的复杂工件识别定位问题,比如异型件、大尺寸工件以及三维工件,由于振镜幅面以及相机幅面的限制,存在加工或拍摄只能针对工件局部的情况,然而处理这些情况用到的平台移动和图像拼接技术自身会引入误差,影响加工精度。考虑上述原因,本文利用机器视觉技术,基于模板匹配图像算法的原理,提出了利用局部图像特征匹配整体理论模型特征的识别定位方案,
学位
随着当代互联网信息技术的不断蓬勃发展,不论是在农业、工业还是商业等各个领域,其技术都得以广泛应用并实现了巨大的便利化和高效化。其中分布式系统由于具备开放性以及异构性等特点,具备高性能、高可用性、并发处理等优势,渐渐成为计算机系统发展的大方向,并已有众多极为出色的实例。与此同时广大的互联网用户以及各类网络应用也对服务器的网络带宽以及数据处理能力提出了更高的需求。例如具备大访问量用户的Web服务需要满
学位
近年来,二维过渡金属硫族化合物(TMDCs)因其极薄的的尺寸、天然的带隙和优异的光电特性成为国内外的研究热点。而硫化钼(Mo S2)是最典型的TMDCs之一,它具有高迁移率、高透明性、优异的机械延展性和光电特性,使其在光电器件、柔性电子等众多领域受到广泛的关注。因此,制备出高质量大尺寸的硫化钼薄膜和优异性能的场效应晶体管具有重要意义。本文计算出N+和N2+离子掺杂Mo S2过程中的形成能,通过理论
学位
近年来,随着光纤制造技术的飞速发展,与之密切相关的光纤传感技术逐渐进入了众多研究人员的视线。光纤传感器由于结构微小、质量轻和抗电磁干扰等优异的特性已经广泛应用于各种产业,其中模式干涉型光纤传感器以其灵活性、紧凑性和多功能性的特点在光纤传感器中表现出极大的研究优势。目前,人们逐渐将目光投向了如何充分利用光纤的特性实现多参量的测量,这也是现如今光纤传感器的研究热点之一。本论文的研究主要以光纤线内模式干
学位
股权分置改革后,中国股市进入了全流通时代,控股股东纷纷将原“分拆上市”剥离出来的资产注入上市公司,资本市场上掀起了资产注入型定向增发的浪潮。近年来,国企改革的推进使资产注入型定向增发得到了更为广泛的应用,但许多上市公司实施资产注入型定向增发后的经营状况并不理想。在这样的背景下,对上市公司发生的这一兼具融资与并购双重性质的重大交易事项进行研究,通过对综合绩效的探析总结存在的问题并提出改进的建议,可以
学位
光纤水听器能够探测到水下声信号的相关信息,在海洋的探索中发挥着巨大的作用。其中,干涉型光纤水听器对水下声信号的响应极为敏感,且具有频带宽,信号传输损耗小,能在恶劣的水下环境中实现长期、稳定的工作等优点,被广泛被应用于环境监控,石油勘探,地震检测,军事等方面。作为整个系统的最后一环,解调算法直接影响着水听器的性能,本文对相位生成载波(Phase Generated Carrier,PGC)解调算法做
学位