基于微博文本的热点事件情感分析研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:successfully_
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,中国网民的规模越来越大,微博作为大型网络社交媒体,为网民们提供了一个表达自己情绪和观点的平台。在这个每天都能快速接收到巨量信息的时代,一些突发的重大事件往往会迅速传播并得到人们的广泛议论。在高度自由化的网络环境中,微博这类传播短文本信息的平台很容易产生舆情危机。了解人们对于热点事件的情感倾向,从而对舆情危机进行及时有效的管控,具有很强的现实意义。在过去热点事件情感分析的研究中,往往分析不够全面。大多通过建立情感词典进行分析,不能识别文本的隐藏含义,算法效果不够好,也很少研究热点事件的主题及情感变化,缺乏对具体事件的分析。本文以近期热点事件的网络舆情为例,在微博上爬取2020年6月至2021年6月之间热度较高且具有代表性的四个热点事件的相关评论信息,将其作为微博热点事件情感分类数据集。此外,数据集还包括:微博情感分类的公开数据集Nlpcc2013和Nlpcc2014。对于评论中中文文字以外的表达形式,过去的论文直接将这些内容进行剔除,本文认为这些数据不能仅看作噪声。本文构建了一个数据集中占比较高的非中文表达转换中文词表,对可能包含情感倾向的非中文表达进行替换。由于人工标注所需的人力成本较高,面对可能出现的数据量小、多样性不足等情况,本文提出在进行情感分析前,先做文本数据的增强。在算法的研究方面,本文基于机器学习方法和深度学习方法对BERT的原生模型进行了改进,通过ALBERT的最后一层与其他分类模型进行多方法组合构建情感分类模型,并在三个数据集上进行验证。结果表明,ALBERT-LR模型和ALBERT-SVM模型有不错的准确性,训练耗时较短,特别是通过ALBERT-SVM进行情感分类,精确率、召回率、F1值相比ALBERT原模型均提升了一到三个百分点。此外,本文选取了新疆棉花事件进行具体的分析,融合TF-IDF和ALBERT对LDA主题模型进行改进,然后通过对评论的主题发现,得到微博用户对于该事件最关注的话题及对应的态度。最后,将每条评论的情感值结合评论的点赞数计算日情感均值和月情感均值,分析事件的演化过程,并且对热点事件分阶段进行主题分析及情感分析。结果表明,人们持有积极态度的时间相对较长,在事件的活跃期,人们的情感有明显的波动,但没有出现过低的日情感均值。可见,大多数人都比较理性地看待该事件。本文通过构建主题分析和情感分析模型研究热点事件的演化过程及人们的态度,为管理部门了解舆情的发展、有效防控舆情危机提供参考。
其他文献
快速发展的数字平台企业成为推动数字经济发展的中坚力量。利用对平台边界资源的控制,数字平台所有者采取相应的开放策略,吸引平台两端的用户,由平台互补者向终端消费者提供所需的产品或服务。开放会导致数字平台所有者面临平台分叉、边界资源的不合规利用等风险,因此开放程度策略选择是影响数字平台持续发展的主要因素。2021年,清华大学和伏羲智库联合发布的《中国数字平台开放性指数研究报告》指出我国数字平台企业的开放
学位
抖音凭借内容丰富、视听体验好、社交互动强等特点,吸引了大量网络主播、用户加入,逐渐成为新型媒体营销场所。主播营销的关键在于精准定位用户需求掌握用户行动,短视频内容运营是其主要工作。根据抖音流量划分机制,用户对短视频的参与行为决定了主播被分配的流量,如何使创作的内容吸引更多用户参与,是带货主播必须要考虑的问题。然而,却少有研究关注主播带货的内容营销问题。因此,本文从主播短视频文案内容信息特征和抖音用
学位
在系统达到稳定状态或者实现控制目标时,如何有效地减少控制的计算和通讯以及降低材料和能源等的消耗,进而降低成本,提高资源利用率,成为当前控制领域的研究热点。面对这种情形,事件触发控制近年来成为了控制领域的重要研究方向。同时,在考虑事件触发的基础上,引入由跟踪误差驱动的动态增益,这不仅使得控制跟踪目标的实现更容易,而且避免了仿真中参数的频繁调整。此外,在实际的工程与应用中,系统大多都是非线性的。由于非
学位
电动汽车技术的开发有助于缓解能源危机和环境污染,因此世界各国都在致力于推动电动汽车的发展。中国应该抓住这历史机遇,奋力实现在电动汽车领域的弯道超车,引领全球电动汽车产业的发展。目前汽车市场中主流车型仍是燃油车,如何让消费者为电动汽车买单,提高电动汽车在新车销量中的占比,这需要政府和车企长期付出努力和共同行动。目前有效的解决办法之一是深入了解消费者对电动汽车的购买意愿,从而制定策略来推进电动汽车产业
学位
城市餐厨垃圾回收及处理水平不仅代表着一个城市的发展水平,更是推动城市可持续发展的重要因素。就目前来看,居民垃圾分类意愿低、垃圾回收及运输环节混合收运、处理环节规范性不足以及政府监管不力等都成为了餐厨垃圾回收过程中的阻碍;为积极响应国家政策,城市餐厨垃圾回收处理过程中温室气体排放量大、有害气体难处理等问题也应该被高度重视。基于此,本文针对居民参与垃圾分类、回收企业考虑碳减排的餐厨垃圾逆向供应链博弈模
学位
多智能体系统(MASs)由大量相互联系的智能体组成,它具有更智能、更高效的解决问题的能力,因此MASs受到广泛关注。一致性作为MASs协调合作控制的基本问题,目前的研究成果大多数是渐近一致。然而为了达到有限时间区间上的精确一致,自适应迭代学习控制(AILC)方法在多智能体的研究中占了重要地位。通信拓扑对于MASs的一致性控制具有重要意义。有向图的邻接矩阵是不对称的,相比无向图,增加了控制协议设计的
学位
氮化镓(GaN)作为第三代半导体材料,具有高电子饱和速度、高击穿场强以及高工作温度等特点,凭借这些优势使得Al GaN/GaN高电子迁移率晶体管(HEMT)在高频、高温及大功率领域被人们广泛研究和应用。近年来,柔性电子器件凭借其良好的电学特性以及可靠的机械柔韧性,逐渐进入了人们的视野,其中柔性GaN HEMT器件在未来的可穿戴设备以及小型化无人机领域中的射频收发模块将扮演重要角色。然而目前的柔性G
学位
非线性方程组和多模态优化问题是科学研究和工程应用中两类典型的多解问题,对它们的求解具有重要的现实意义。传统方法要求问题可微、对初始点敏感且在一次运行中只能找到一个解。面对复杂高维的实际问题,传统方法已经无法满足需求。进化算法作为一类基于种群的算法,对问题没有要求且具有同时找到多个最优解的潜力。本文将非线性方程组和多模态优化问题作为主要研究对象,利用差分进化算法和小生境技术对这两类问题进行求解,主要
学位
在现实生活中,为了对海量数据做出正确有效的分析,人们通常会借助于统计学习。这是由于统计学习能够帮助人们提取数据中的重要特征,抽象出关于数据的模型,挖掘数据中包含的信息。分类作为统计学习的主要研究范畴之一,通过对数据建模,探索并掌握其中的规律,然后可以对未知数据做出预测。多年来,分类始终是众多研究学者关注的热门话题。多标签学习是分类问题中一个重要研究方向,其中每个实例对应多个标签。在数据是独立同分布
学位
多目标优化问题是工程应用和科学研究中普遍存在的一类问题。该问题具有多个相互冲突的目标,通常没有可以在所有目标上都达到最优的唯一最优解。演化多目标优化算法因对目标函数的性质没有要求,且具有全局优化的能力,成为当前主流的求解算法。然而,它们存在收敛速度慢,搜索效率低等问题。传统无梯度算法收敛速度快,有希望提高演化多目标优化算法的求解效率。本文的主要研究目标是将无梯度算法融入到演化多目标优化算法中,设计
学位