基于深度学习的舆情情感分析

来源 :东华大学 | 被引量 : 0次 | 上传用户:xianyekong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的飞速发展,各种社交网络平台尤其是移动社交网络平台持续增加,由此产生了海量的舆情信息。网络舆情具有明确的情感倾向性,并且其情感倾向极易传播与感染,甚至会影响事件的发展态势。因此,如何从庞杂的舆情信息中提取出热点话题,并分析各热点话题的情感倾向,对于发现公众关注焦点、提取舆情走势、把握舆论走向,并进一步引导正确的舆情传播方向、保障社会和谐稳定具有重要意义。
  情感分析作为舆情分析最重要的环节之一,在传统方法中主要是借助情感词典与规则和浅层机器学习的方法来完成的。但是舆情信息句式复杂,隐喻、反讽较多,而传统的浅层学习方法难以获得较高的情感分类准确率。因此如何根据舆情信息的特点,进一步提高中文舆情信息的情感分类准确率,是目前舆情分析领域急需研究与解决的问题。针对传统情感分析的不足,本文采用深度学习的方法对中文情感分类问题进行了深入研究,并将其应用于网络舆情分析中,本文的主要研究工作如下:
  (1) 在文本数据预处理中,基于词共现技术来训练词之间的语义联系,使用word2vec模型预训练词向量,解决了传统one-hot编码带来的维度灾难的问题,模型训练后得到低维稠密向量。
  (2) 本文对现有的深度神经网络模型进行改进,提出了一种联合深度神经网络模型,将训练好的文本词向量输入卷积神经网络中自动提取文本高维特征,再根据文本序列的特点,将提取的高维文本特征输入长短时记忆神经网络中进一步学习文本远距离依赖特征。最后将该模型应用于2017年榆林产妇跳楼事件舆情中进行情感分类,对模型参数进行对比实验确定模型最优参数值,再将该模型与其他情感分析领域常用机器学习模型进行对比分析,验证了该模型的有效性。
  (3) 针对舆情信息主题丰富、易随时间改变的特点,提出了舆情主题分析模型和舆情情感演化模型。使用LDA模型从一段时间内的舆情文本中提取主题,并根据转发量和评论数计算得到舆情热度值,得到热度最高的几个舆情主题。对特定热点话题相邻时间片内子话题之间的相对熵进行计算,判断相邻时间片内主题之间的关联程度,从而分析出是否有子话题的分裂、新话题的产生。再对评价对象进行抽取,结合联合深度神经网络模型对不同时间内各评价对象的情感进行判断,从多个维度对该热点话题的情感演化进行分析。
  (4) 利用所提出的模型对2018年6月至7月30多万条网络舆情信息进行多维分析,同时通过增加主题特征进行融合提高了情感分类准确率,通过对比实验,验证了模型的有效性,对于舆情的时变性与舆情的主题演变得到了有价值、可借鉴的结果。
  本文针对舆情信息的特点对现有的深度神经网络模型进行了改进,并在此基础上提出了舆情主题分析模型以及舆情情感演化模型,对热点话题进行提取并从热度、话题转移、情感演变等多个维度进行分析。本文提出的模型对舆情情感分析准确率的提高、舆情热点主题的提取以及热点话题的多维情感分析具有重要意义。
其他文献
水下传感器网络是由具有声学通信与计算能力的传感器节点构成的网络系统,其是开展海洋数据监测处理的重要技术手段。相对常见的海洋通信系统,水下传感器网络具有基础设施简单、节点体积微小和设备成本低廉等优势,在海洋数据采集、环境监控、资源勘测、地震与海啸监控、海洋军事科学、辅助导航、水下机器人和AUV控制等方面具备广阔的应用前景。传统的水下传感器网络极大的依赖硬件基础架构,存在应用和服务受限,管控和维护困难
对称密码是密码科学的重点研究内容,被广泛应用于数字签名、电子支付等领域。近年来,随着无线技术的不断发展,物联网正在逐步深入到人们生活的各个领域中,但由于计算处理设备容量有限,传统的密码算法不能有效地保证其中的数据安全。轻量级对称密码正是因此应运而生,它通过改变算法中所使用的一些组件来保证数据安全,具有分组长度短、结构简单、资源消耗少等特点。然而,在实际应用中,轻量级对称密码算法的硬件载体可能会受到
随着科技和文化的发展,服装已不再是过去保暖的工具,它更是展现自我的方式。如今面对海量的服装数据,传统的服装推荐虽能达到良好的推荐效果,但由于过分依赖用户历史行为数据而经常出现冷启动和数据稀疏问题,同时因为忽略上下文环境,导致推荐结果达不到用户特定场景下的需求。因此,对服装个性化推荐的研究变得十分有意义。  知识图谱的本质是语义网络,它揭示了世间万物之间的关系。而服装本身自带了诸多属性和知识,但目前
学位
随着光伏发电提供的电量在世界总电量中的比重逐年增加,光伏发电在日常生活中所占的地位也越来越重要,这就要求光伏发电系统有更高的可靠性和安全性,同时,也对光伏发电系统中的主要电力设备——光伏逆变器的可靠性提出了更高的要求,一旦光伏逆变器发生故障而没有及时的诊断出来并将以处理,将会造成不可避免的重大损失。因而及时的故障诊断和定位是一个亟待解决的问题。基于对大量的运维数据的分析,可以发现实际运营中产生的光
糖尿病是一种常见的慢性病,据世卫组织发布的2016年公报统计,中国共有约1.1亿糖尿病患者和近4亿糖尿病前期人群。除了患者人数众多,糖尿病还是一种难以根治的终身性代谢性疾病,且其并发症很可能威胁到患者生命,所以需要尽早预防和及时控制。在糖尿病的临床治疗过程中,每名患者都需要不定期地多次去医院进行诊疗,治疗周期长、治愈较困难,导致了糖尿病专科领域的医生数量与患者数量严重失衡,因此,如果能够对糖尿病临
电子病历记录了患者在检查与治疗疾病过程中产生的重要临床数据,包含大量的医疗知识,通过挖掘和利用这些知识对于医疗健康事业的发展有重要作用。但是,目前大部分电子病历都以非结构化的文本形式存储,一是难以从这些杂乱、冗余及高复杂的文本数据直接获取规范并有价值的数据;二是无法直接应用人工智能算法去进一步挖掘分析。因此,电子病历的结构化问题成为人工智能时代研究的热点,在医疗领域中最重要的工作主要集中在实体识别
学位
在信息科技技术快速发展带动下,社交网络也在以前所未有的规模进行发展,对于社交网络使用的用户数量也在与日俱增。大量的用户信息给予了社交网络分析极大地便利,研究者对社交网络数据进行分析可以得到很多有用的信息。用户在使用社交网络技术的过程中,被动或者主动的将自己的个人隐私或与其他用户之间的关系等各种敏感信息公之于众。这些敏感信息的泄露对于用户造成很大的麻烦甚至是经济上的损失。因此对于社交网络中用户的隐私
学位
在当今大数据时代背景下,数据质量直接影响相关任务的有效性。数据质量专家估计,错误的数据可能会使企业损失其系统执行预算总额的10%到20%,并且一个项目的执行可能需要花费40%到50%的项目预算在数据清洗中。数据清洗是一个耗时,耗力和繁琐的过程。数据质量的好坏直接影响企业决策和科研结果的正确性和有效性,因此,研究者提出了多种数据清理的方法,以便(半)自动地识别错误,并在可能的情况下纠正它们。  在过
学位
传统的士兵格斗训练以实战对抗方式为主,这种模式容易对士兵造成伤害,带来不必要的风险。且人工评判难以保证计分的客观性,训练周期不可控。随着智能行为识别技术的发展,自动化分析系统得以广泛运用于军事、工业、医学等领域,辅助人工进行过程化控制。  本文研究的格斗评估系统基于立式人形搏击靶(下文简称搏击靶)平台,并配置了加速度和地磁传感器,实现对士兵格斗过程的监控与分析,对诸如拳击力量、方向、时间及攻击部位
学位
随着计算机视觉技术的不断发展,图像分类、图像检测和图像检索的研究成果也不断地被应用到现实生活中。深度学习中的卷积神经网络以其强大的特征提取方式和独特的学习方式,为计算机视觉领域带来了革命性的突破,如何将深度学习方法应用到图像领域已成为新的研究热点。  本文针对“以图搜衣”的传统解决方案不能满足用户高准确度需求的问题,设计了一种从商店时尚服装展示图片中检索街拍时尚服装的方法:首先运用深度学习方法对街
学位