基于注意力机制和神经网络的文本情感分析方法研究

来源 :华中师范大学 | 被引量 : 2次 | 上传用户:nini126
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的不断发展,越来越多的用户在网上分享自己的观点。社交网站和购物网站上隐藏着大量的用户情感信息。如何从这些海量数据中挖掘出有效的信息并加以利用已成为研究的热点。文本情感分析就是对文本中深层次的情感信息进行探索和分析,通过一定的方式找到文本中的有效信息并加以利用。然而,现有的情感分析模型无法有效的提取文本深层次的情感信息,并且缺乏提取文本内重要信息的能力,为了进一步提高情感分析的水平,针对不同模型的特点,本文提出了相应的改进方法,具体研究内容如下:(1)针对传统循环神经网络对长序列处理时可能导致信息丢失和梯度弥散,并且目前基于深度学习的分析模型没有加强对情感词的关注等问题,本文设计了BiAGRU模型,将注意力机制和双向循环神经网络结合起来,使用注意力机制得分来代替GRU模型中的更新门的值,并进行正反双向传播。对于文本中较为重要的词给予更多的注意力,增强重要词汇的相关权重,加强对长序列语义信息的学习。实验结果表明,该算法相较于一些传统方法,在多个方面都有提升。(2)针对卷积神经网络在使用ReLU激活函数时,对于梯度值为负的情况,可能会出现神经元坏死的问题,本文使用PReLU激活函数来代替ReLU激活函数;针对最大池化层只保留一个最大值,忽略其他强特征,会丢失大量特征信息的问题,本文使用K-Max Pooling对池化层进行改进,通过保留多个强特征,使文本的一部分信息得到保留,这些改进使得文本卷积神经网络具有更好的文本特征提取能力,更适合进行文本特征提取。(3)针对卷积神经网络会忽略上下文语义信息,但对局部信息具有较强的敏感性,而双向循环神经网络能够很好的提取全局信息的特点,本文设计了融合NTexCNN模型和BiAGRU模型的多通道文本情感分析模型TC-FFA-BiAGRU模型。首先,使用Jieba分词工具和Glo Ve词向量模型对文本数据进行预处理;其次,通过改进的NTexCNN模型和BiAGRU模型分别对输入向量的局部信息和全局信息进行提取;再通过特征融合层将两种特征向量进行融合,并将融合后的特征送入强制向前的注意力机制层,最后通过全连接层实现情感分类。实验证明,相比于传统的网络模型以及CNN-BGRU和CNN-BiG RU等一些拼凑模型,本文的模型有较好的情感分类效果。
其他文献
面部表情识别是机器理解人类情感、情绪的途径之一,在人机交互、学习分析等领域有着广阔的应用前景。受制于面部表情图像固有的类内差异,面部表情识别技术尽管在近几年取得了可喜的进展,但现有算法的精度与实际应用要求仍有较大差距。导致面部表情图像类内差异的原因至少包括:(1)主体身份特征和面部表情特征交织。从面部图像上提取的特征中势必包含大量的主体身份信息,造成同种表情不同主体的图像在特征空间距离较大。(2)
学位
随着互联网经济的快速发展和移动终端的普及,基于位置的服务迅猛发展,与此同时,随着路网的不断发展和完善,路网中带有位置信息的对象迅速增加,在大规模路网中高效地查询给定两个顶点的最短距离成为数据库界研究热点。为了实现路网中的相关查询,人们提出了一些创新性的索引技术,例如:G-tree和G*-tree,它们对路网空间按区域进行划分,然后采用树形结构进行组织。尽管现有的技术能对路网进行有效划分和组织,但是
学位
知识追踪(Knowledge Tracing)是指根据学生历史答题情况对学生的学习状态进行追踪,它可以挖掘出学生对知识点的掌握程度并且对学生将来的答题进行预测。近年来,随着在线教育的兴起,许多线下教学慢慢转变为了在线教育,这种方式可以突破传统教育所带来的时间和空间上的约束,提升学习效率,也可以使教育资源公平化,避免了因地域环境所带来的教育资源分配不均匀的问题。然而随着在线教育机构越来越多,一些问题
学位
室内三维建模可服务于室内导航、室内设计、虚拟现实以及城市建设等方面,同时对于3DGIS、虚拟现实VR和室内导航具有重要意义。为解决现有的三维建模的方法中存在的点云数据边界模糊、缺乏语义信息、三维模型拓扑关系模糊,以及模型驱动三维建模中存在的自动化程度低等问题,本文使用了基于深度学习的结合了 Kinect数据与模型的对室内规则物体进行精细化、自动化三维建模的方法。具体建模步骤为:(1)在数据驱动下,
学位
随着互联网时代人工智能与大数据的兴起,“互联网+教育”理念使得中国教育发生着改革。从古至今,“因材施教”一直都是我国教育界秉持的教学理念,即针对不同的学习者设计个性化教学方案。随着科技和社会的发展,学习者个性化特征获取与量化有着相应的理论体系,个性化的学习方案也得到了相应研究。在各方面研究的促进下,自适应学习系统也得到了有效发展,但由于推荐效果不理想也限制了自适应学习系统向着更深层次发展,所以如何
学位
近年来,随着人工智能话题被广泛讨论,深度学习技术逐渐成为了当下互联网时代的研究热点。在计算机视觉领域,往往更偏向于使用深度学习技术来解决语义分割、图像分类以及人体姿态识别等问题,相较于传统算法,其优势在于可通过大量样本自主学习特征来达到目标要求。本文主要研究微小型接线柱上绕线匝数的视觉计数问题。现代工业中零件尺寸越来越小,质量要求越来越高。为了保证整个零件功能的完整性,必须在绕线完成之后进行绕线计
学位
容迟网络(delay tolerant network,DTN)是一种不存在稳定端到端链路的新型网络,由于这种网络具有网络拓扑结构动态变化、传输时延高以及资源有限等特点,节点的移动无法预测,消息在源节点与目的节点之间的传递很少存在直达的链路。因此,在容迟网络中节点之间采取“存储-携带-转发”的消息传输机制,携带消息的源节点利用中继节点作为通信媒介,最终将消息转发到目的节点,完成整个消息的传输。容迟
学位
在大型物理实验装置中包含多种探测器,将探测器的输出进行数字化采集并根据数据分析粒子的信息是物理实验的重要环节。量能器主要用于测量粒子的能量,输出通常表现为脉冲信号的形式,在脉冲信号中提取时间与幅度信息是粒子分析重要的一步。脉冲特征提取有很多方式,如曲线拟合、种群技术等。随着探测器实验数据量的不断增加,探测器环境中往往包含随机噪声、长期漂移、短期改变等影响。传统的数字化处理方式在消除探测器环境中噪声
学位
在技术飞速发展的当下,舰船上设备间的数据传递更加繁多、复杂,作为舰船上各种系统信息传输的基础平台,舰船网络所承担的数据交换和信息共享需求与日俱增。由于舰船上的设备种类多种多样、不同的设备产生的数据格式也不尽相同,直接进行舰船网络设计需要耗费大量财力物力,因此需要行之有效的验证工具,模拟出多种数据流来对舰船网络的信息交互进行研究。本文提出了舰船网络仿真模拟系统的方案,建立仿真环境得到舰船网络的性能指
学位
近年来,随着教育信息化的快速发展,推进了数字教育资源的共建共享,缩小了城乡间的教育资源差距。但是,由于互联网信息规模大,数据杂乱且无序,碎片化严重,而教科书仅有知识框架,也不足以为学生提供完整的、全面的知识内容体系。知识图谱的出现为教师和学生提供详细的学科知识体系和清晰的知识组织关系,有助于提高学生的学习效率,对于教师的备课上课也具有指导意义。指代是指在下文采用简称或代词来代替上文已经出现的某一词
学位