文本情感分析的特征表示方法研究

来源 :南京信息工程大学 | 被引量 : 1次 | 上传用户:guao_jie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的快速发展极大地降低了人们接收和发布信息的门槛。海量的网络文本包含民众对事件与商品的看法,通过大数据分析以及情感挖掘能够帮助政府了解事件的舆论走向,也能为推荐系统提供数据支撑。面对指数级增长的评论文本,传统的情感分析方法已捉襟见肘,因此本文以深度学习方法为基础,围绕目前情感分析中存在的文本特征表示不充分、不准确的问题展开研究,面向不同类型的情感分析任务构建更准确的文本特征表示方法,本文的具体工作与创新内容如下:(1)针对现有的中文词嵌入表示仅包含一种粒度信息、存在特征不充分的问题,提出了一种字粒度与词粒度特征融合的方法,该方法使用全模式分词得到更丰富的词序列,经词嵌入后将词向量输入双向长短期记忆网络提取全文的语义信息,并将隐层语义表示与对应字向量进行初步融合,增强词级信息的鲁棒性。另一方面将字向量输入多窗口卷积,捕捉更细粒度的字符级特征。最后将字词粒度特征进一步融合后输入分类器进行分类。实验结果表明,采用该方法的模型相比同类模型在分类性能上有一定提升。(2)针对评论类文本多方面词多意见词共存导致的情感特征表示不准确问题,提出了一种方面级特征表示方法,构建了基于词共现的方面级情感分析模型(BCGN)。该模型利用BERT获得包含上下文与方面词交互注意力的节点信息。同时,对每条数据样本构建独立的词共现图,使用门控图神经网络更新节点,加强方面词附近信息的融合、减少无关意见词干扰,提高特征表示的准确性。之后在自注意力层进一步融合全局信息,得到最终方面级情感特征表示。对比实验表明采用该方法的模型相比同类模型在分类性能上有进一步提升。(3)针对中文句式多变,现有的模型在提取深层语义信息上仍有欠缺的问题,提出了一种深层语义特征表示方法,构建了基于语义依存图的方面级情感分析模型(MGSem GCN),该模型通过语义依存图关联句子中的语义单位,跨越句子浅层句法结构上地束缚,可以获得深层的语义信息,并利用图卷积网络使信息在词与词、层与层之间传递,之后对其输出计算自注意力,加强关联性,再和字符级特征融合,得到最终方面级情感特征表示,对比实验表明采用该方法的模型相比同类模型在分类性能上有更进一步提升。
其他文献
传统深度神经网络剪枝算法通常旨在消除网络中的冗余结构,以轻量化神经网络。然而,目前一些研究发现一个过参数化的随机初始化神经网络中的稀疏结构本身就具备很好的性能,并设计了一些剪枝算法以找到隐藏在过参数化神经网络中的稀疏结构。这些研究表明剪枝也可被用来寻找过参数化神经网络中的稀疏结构,本文重点研究了基于掩膜学习的神经网络剪枝算法,通过学习掩膜来找到过参数化神经网络中的稀疏子网络。本文具体进行了以下两个
学位
最近,国家为助力实现“碳达峰”和“碳中和”目标,由工业和信息化部等部门联合发布了《电机能效提升计划(2021-2023)》。电机各项性能的要求越来越高,考虑单个目标的电机性能设计已经很难满足现实设计需求,电机的多目标优化设计成为了电机达到高效节能目标的重要途经。本课题以一种新型轴向磁场永磁记忆电机(axial flux permanent magnet memory motor,AFPMMM)为研
学位
随机非线性系统指的是输入输出及干扰项存在随机因素或者系统本身带有某种不确定性的非线性受控系统,它可以在金融、股票清算、电力系统建模和人口动力学等方面提供一个良好的数学建模框架。对于控制系统来说,稳定性是研究控制系统首要解决的问题,所以近些年来,关于随机非线性系统的稳定性问题一直是专家学者深入研究的热点,并取得了一系列优秀的研究成果,但仍有许多关于随机稳定的问题值得近一步讨论和改进。因此本文研究了基
学位
随着科技发展和社会进步,各个领域对预测模型的精度、稳定性要求越来越高。近年来,深度学习中的循环神经网络(RNN)技术,特别是其与另一深度学习技术-卷积神经网络(CNN)相融合的CNN-RNN架构在预测中显示出强大优势。但基于RNN的模型在预测任务中存在滞后性,流行的CNN-RNN架构也未解决上述问题。注意到宽度学习系统(BLS)具有权重计算直接、运算快速高效的优点,本文尝试融合宽度学习和深度学习的
学位
显著性目标检测旨在识别出图像中最显著的对象与区域,目前已经成功地作为目标跟踪、物体识别以及语义分割等计算机视觉领域任务的预处理过程。传统方法大多依靠颜色,纹理等手工特征或者启发式先验来捕获图像的局部细节以及全局上下文信息,受制于特征的表达能力,在复杂场景中检测显著物体的能力大打折扣。近年来,卷积神经网络快速发展,得益于海量的数据以及模型强大的特征表达能力,基于深度学习的算法在性能上有了巨大提升。本
学位
海洋暖涡观测需要多智能体之间的协同以及任务分配,尤其是异构智能体之间的协同可以充分发挥不同智能体之间的特点。在多智能体的暖涡观测中,合理的任务分配可以保证系统以最小的代价完成全部任务,这是多智能体多任务问题的研究热点之一;路径规划是智能体在已知或者未知环境信息的前提下执行任务时,为智能体提供从起始点到终点的可行路线。以上述为前提,本文开展了面向暖涡观测的多智能体路径规划研究,主要研究内容如下:1、
学位
全卷积孪生网络目标跟踪算法由于其很好地平衡了精度和速度的关系而得到快速发展。但是仍然存在一些难点限制其跟踪性能,如背景混杂、遮挡以及形变等。特别是在相似背景信息干扰下会出现跟踪漂移,而且现有的基于锚框生成的目标跟踪算法超参数多,带来额外的复杂度和计算消耗。此外,只利用卷积神经网络提取的单一层语义信息做跟踪预测会导致图像信息利用不充分,不能形成更鲁棒地跟踪,而简单的将多层特征自适应融合的效果并不理想
学位
雾天能见度降低给高速公路的通行效率与安全运营带来了极大威胁,全方位高效的能见度检测对交通管理具有十分重要的意义。随着高速公路监控设备的普及,通过构建基于监控图像的能见度自动检测方法,能够在降低成本的同时实现密集的大范围检测。然而由于成像设备及成像条件存在差异,且监控图像特征与能见度类别之间具有复杂的非线性关系,如何依据图像进行准确的能见度检测是一项具有挑战性的任务。鉴于深度卷积网络优异的特征学习能
学位
运动捕获数据作为一种新型的多媒体数据,在影视,游戏和医疗康复领域都得到了广泛应用。此类数据通过记录每一时刻人体关节点的位置和朝向,构成整个运动帧序列。由于其捕获到的人体位置信息非常的准确,能够在各种复杂的场景中刻画出人物模型的运动,给人以强大的视觉冲击,因此获得了大量用户的青睐。但专业的运动捕获设备价格高昂,所以只有大型的机构或公司才能完成运动捕获的任务。运动合成技术由于能够利用现有的运动数据,通
学位
对于实际应用中的复杂系统而言,通常存在由于多种类型干扰的存在而造成的系统工作效率下降等问题,这种类型的问题也正是整个控制领域重点研究的问题之一。目前已有一些控制算法能够在一定程度上缓解效率下降的问题,但是一般控制系统中,控制器一旦设计完成之后,其参数不便更改。针对此类问题,在多种类型干扰作用的控制系统中,本文在上层通过规划与调度获取最优设定值,然后应用两层结构运行优化控制方法结合其它控制方法来优化
学位