基于深度学习的文本情感分析

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:FANSHENGHUA2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本情感分析是自然语言处理领域中一项重要任务。随着互联网的发展,网络上出现了大量的文本资源,对其中蕴含的情感进行分析可以提炼出巨大的价值,为政府和企业等机构的决策提供支持。本文主要关注文本情感分析领域中的两类任务:句子层级与目标层级的情感分析。同时,探索深度学习在情感分析领域中的研究方法和创新,主要研究工作如下:(1)在句子层级的文本情感分析任务中,基于顺序特征的长短期记忆网络等结构只提取到了文本的序列特征,但缺乏对文本结构特征的考虑。针对该问题,将树形神经网络,一种能提取文本结构特征的模型,与长短期记忆网络结构相结合,提出TC-LSTM、LT-LSTM和LCT-LSTM三种新模型。(2)在目标层级的文本情感分析任务中,基于长短期记忆网络的模型往往结构复杂,参数较多,训练时间较长,且不能较好地对目标词进行特征表示。针对这些问题,本文设计一种基于注意力结构的神经网络模型:AB-TBSA,该模型使用自注意力层取代长短期记忆网络结构进行文本特征提取,同时使用一层额外的注意力结构单独地作用于目标词,并加入批量规范化层来进行优化。最后,尝试使用Skip-gram模型来训练每个单词的位置特征向量,以此为注意力模型加入单词的位置信息。句子层级情感分析任务的实验在SST数据集上进行,改进的模型在该数据集的二分类和五分类任务中分别最高达到了88.7%与51.0%的准确率,均优于单独的长短期记忆或树形神经网络模型。实验验证了将文本的序列特征与结构特征相融合的可能性。目标层级情感分析任务的实验在Semeval-2014数据集上进行,基于AB-TBSA结构的模型在数据集的Laptop和Restaurant子集中分别最高达到了72.76%与78.29%的准确率,均优于近年来基于LSTM的模型。通过实验分析也进一步地验证了AB-TBSA模型的精简和高效。通过对注意力层权重的可视化表明,AB-TBSA模型能够较好地适用于目标文本情感分析任务。最后,位置特征向量的实验表明其有微弱的效果,但是还有待进一步地被进行改进。
其他文献
行政批示是我国政治权力运行的重要方式,它构成行政管理过程中最为关键的环节,并贯穿于整个行政管理之始末。如何构建完备的行政批示法律规制机制,对于全面推进依法治国具有重要价值。行政批示法律规制的根本目的在于将行政批示纳入法治化轨道,实现行政批示运行的制度化和规范化。在我国科层制体制背景下,行政批示具有深厚的理论内涵,时刻影响着我国行政运行的内部和外部秩序。它对内表现出批示不当、无批示不作为、批示落空、
近年来,随着无线通信、移动定位、互联网、云计算等技术的快速发展,人们能够源源不断地获得海量的轨迹数据。轨迹数据具有明显的时空特征和流式特征,通过分析和挖掘,能够一定程度上反映出移动对象的运动模式。时空轨迹聚集模式是时空轨迹模式中的一个重要研究内容,主要用于发现异常或典型性的群体事件,被广泛应用于人类行为模式、交通物流、动物习性、市场营销等领域。目前,时空轨迹聚集模式挖掘算法研究取得了一系列成果,但
网络不正当竞争行为主要包含以下两种方式,一般的市场竞争行为在互联网领域的表现以及在互联网经济下衍生的新型竞争借助技术措施进行的。本文主要讨论的是以劫取流量为手段的不正当竞争行为,以案例争议焦点为中心进行论述,全文分为三个部分。第一部分探讨了反不正当竞争法所规定的行为主体。行为主体不应当局限于经营者这一概念,而应该扩大范围到市场的参与者,同时关于竞争关系的应用。本文认为竞争关系不再是判定不正当竞争的
近年来,用户需求呈现爆炸式增长,不同应用程序对计算需求也越来越大,时延要求越来越高。传统的集中式云计算虽然有充足的计算和存储能力,但应对大量的时延敏感型应用,统一的集中式处理不仅会导致网络拥塞严重,用户距离云基站较远,数据在终端和基站间传输不能保证传输链路的可靠性且会耗费大量时延。因此,移动边缘计算收集利用网络边缘的闲置资源,保证一定的处理能力同时,距离用户更近,满足时延敏感型任务的需求。本文在基
随着改革开放的深入推进,我国经济发展水平提升显著,然而在经济建设和发展的过程中,一些问题也逐渐涌现,例如,住房拥挤、交通堵塞、城市垃圾增加、空气污染加重等,然而这些问题影响着我们的居住环境,所以在城市的发展建设中,人们对人居环境建设的关注持续增加。新疆作为“一带一路”的核心区,同时也处于西北干旱区,生态环境较为脆弱,生态环境对人类的活动的影响关系密切,所以一些城市人居环境问题也开始出现,为了给人类
随着计算机视觉技术在工业控制、目标检测等各个领域的长足发展,越来越多的技术运用到遥感卫星成像、视频监控检测等户外场景中来,并取得了良好的效果。然而当出现雾、沙尘等恶劣天气时,此类室外视觉系统所获图像的质量就会受到影响,算法难以完成既定任务。因此,有雾图像的复原处理,就有着重要的研究意义。因此为了提高单幅图像去雾算法的图像恢复能力,本文主要完成了如下工作:(1)针对合成训练数据集构建过程中,学者对大
中国当代艺术的表现形式通过对外来艺术的不断学习与借鉴,从主题性创作逐渐转变成对个人内心世界的呈现。强烈的个体意识冲击了中国传统文化中的集体主义,在艺术创作中把人性和个性作为核心阐述。中国当代艺术家的思想从固有的意识形态中解放出来,并朝着个性化和多元化发展。本文主要针对“故事性”解读、举例说明、人文情怀、情感表达以及自我创作来分析“故事性”在当代油画人物创作中的重要性。“故事性”绘画的定义是用来描绘
统一战线是党的“三大法宝”之一。新时代坚持统一战线国家战略依然是我党凝聚人心、汇聚力量的政治优势和战略方针,是新时代建设社会主义现代化的重要法宝,是全面增强党的阶级基础、不断巩固扩大党的群众基础、筑牢党的执政根基的重要手段,是全面建成小康社会的决胜关键。在新的历史条件下,对乌兰夫统一战线思想展开与时俱进的剖析研究,可以帮助我们不断扩大团结面,凝聚正能量,为我国“五位一体”总体布局、“四个全面”战略
几十年来,分类器设计取得了很多很好的成果。然而目前一些正确识别率高的SVM分类器、SVDD分类器、深度学习分类器等仍然有2%左右的错误识别率。由于在比较严肃的认证识别场合,要求错误识别率接近于0%,因此这些分类器不能直接用于重大疾病认证识别、人的身份认证识别、钞票认证识别、票据认证识别、恐怖分子认证识别等需要高精度认证识别的场合。针对以上问题,本文基于SVDD算法和仿生模式识别理论的覆盖思想,提出
中国共产党党内监督,是党员和党组织按照党章等党内法规,对党员和党组织进行督查以达到自我完善目的的实践活动。党内监督不仅是中国共产党的优良传统和政治优势,更是中国共产党实现自我净化、自我完善、自我革新、自我提高的重要举措。党的十八大以来,随着党的建设新的伟大工程持续推进和全面从严治党的不断深化,党内监督建设面临着一系列新要求与新挑战。以习近平总书记为核心的党中央高度重视党内监督问题,在吸取党的历史经