面向高校舆情的中文文本情感倾向性分析

来源 :江西师范大学 | 被引量 : 0次 | 上传用户:shadowyin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于互联网技术的迅猛发展,越来越多的用户喜欢在微博等社交媒体上发布自己的观点和评论信息,网络舆情数据也随之快速增长,对这些数据进行分析处理具有重大的价值。由于大学生是互联网大军中的主力,而且相对其他群体活跃度更高,因此高校舆情信息数据量更大,蔓延速度更快,这使得其管理变得更加困难,高校舆情危机频发,对高校造成了严重的负面影响。而对高校舆情信息的情感倾向性分析可以帮助高校的领导和学生工作者更好的了解公众对学校的看法和意见,从而更好的预防和应对这些危机。因此,挖掘出针对某些热点问题的高校舆情文本数据,并对其进行情感倾向性分析,对于保证高校和谐稳定发展具有重要意义。当前在文本情感倾向性分析任务上,深度学习方法是最热门的研究方向,然而现有的深度学习方法对中文文本的特征利用不充分,面向中文语料集的准确率有待进一步提高,另一方面,基于CNN的神经网络通常使用池化来提取数据特征但会导致信息丢失,而胶囊网络使用胶囊向量和路由机制克服了这个问题,并且还能够表示出局部特征之间的位置层次关系,因此本文将胶囊网络和CNN相结合来提取局部特征信息。同时,胶囊网络不能选择性关注文本中重要单词,其路由机制也有待改进。本文研究内容包括以下几个方面:(1)选取近年来一些高校热点事件,如翟天临学术门事件,从微博爬取并筛选出了10000条微博评论数据,再进行情感极性标注工作,制作出一个高校舆情数据集。(2)提出融合汉字形态学特征和HowNet的文本情感分类方法。该方法首先采用cw2vec模型和SAT模型分别训练出词向量;其次,用这两种不同的词向量分别作为该方法两个通道的输入,再结合注意力机制和卷积神经网络提取两个通道的特征;最后输出分类结果。在两个数据集上的对比实验结果表明,该方法在分类准确率上明显优于多种情感分析方法,验证了该方法在中文数据集上具有的显著优势,亦验证了该方法用于高校舆情文本倾向性分析的优越性。(3)提出一种基于注意力胶囊网络的文本情感分析方法。首先依然使用cw2vec模型和SAT模型分别训练出词向量并将其作为该方法两个通道的输入,再结合注意力机制和卷积神经网络提取两个通道的特征,进而输入胶囊网络中实现情感分类,还使用了静态路由机制,相比于动态路由机制具有更高的准确率,在高校舆情数据集上验证了该模型的有效性,并明显优于多种情感分析方法。
其他文献
作为两种典型的电化学储能装置,锂离子和钠离子电池具有污染小、体积小和维护成本低等优点。为了满足日益增长的储能需求,需要探索性能更加优异的负极材料以提升电池的整体性能。本论文主要开展对过渡金属磷化物和氧化物的储能研究,通过纳米阵列结构设计和构筑复合材料,提高它们的钠离子传输系数和电子电导性,进而提升它们作为锂离子和钠离子电池负极材料的电化学性能。针对FeP粉末材料的钠离子传输系数较低(10-13 c
生物源排放的异戊二烯以及单萜烯是挥发性有机化合物(VOCs)的重要组成部分。森林释放的萜烯,经紫外灯照射能与大气中的相关组分发生光化学反应(如OH、O_3以及NO_3),生成的二次污染物(醛、酮以及更高氧化态化合物)通过吸附于颗粒物的形式形成二次有机气溶胶(SOA),这一过程使得臭氧浓度增加及光化学烟雾的形成,而这些不仅影响大气环境还会对人体健康造成危害,如呼吸道疾病。因此研究萜烯在大气中的氧化机
随着国际化进程的加快,人们对于外语学习的需求日趋增加。MALL(mobile assisted language learning),因其便捷性与交互性的特点,成为外语学习的有效工具。然而,现有的MALL单词记忆软件在理论与功能上并未考虑模态设计和模态理论对于不同类型学习者的记忆效应的影响。本研究旨在将多模态理论引入MALL单词软件设计中,利用视觉、听觉、触觉模态的多种组合模式探究通用性的单词记忆
电磁场的空间调控是指根据需求在指定空间区域内产生满足预期幅度、相位或幅相分布的电磁场,其在众多的工程应用领域中都有着巨大潜力。近年来微波医疗、微波加热、保密通信
链箅机回转窑球团生产过程的实时在线监测与控制对提高球团矿产品质量和保证安全生产具有重大意义,这极大的依赖于链箅机回转窑球团生产过程回转窑窑中温度的实时在线测量。
在寿命测试中,竞争风险模型通常是在独立假设的情况下进行讨论。在这篇文章中基于自适应逐步混合截尾(APHCS)恒定应力加速寿命试验,我们研究了多元Birnbaum-Saunders分布(MBS
脂类物质在维持有机体正常生命活动中承担着重要的生物学功能。其中三酰甘油(Triacylglycerol,TAG)是植物油脂的主要储存形式,TAG参与种子萌发和幼苗发育、花粉粒发育、叶片
本论文研究的主要内容分为两个方面.其一是研究了由Hardy空间的再生核诱导的奇异积分算子;其二是研究了小Bloch型空间上的加权微分复合算子.全文一共分为四章.第一章是引言.
人工合成的羟基硅酸镁(MSH)纳米颗粒作为纳米添加剂的一种,具备极佳的减摩和抗磨性能。将MSH纳米颗粒分散到润滑油液中经过长时间放置后,会出现较为严重的沉淀现象。一方面,沉淀现象的发生将导致摩擦学性能的不稳定。另一方面,在大规模生产制备过程中,MSH纳米颗粒从实际生产、分散完毕到真正投入使用的时间跨度极大。因此,改善MSH纳米颗粒的分散性能,是其在投入进一步应用过程中迫待解决的问题。本文的研究目的
超材料吸收器是一种由单元晶胞周期排列而成的人造亚波长结构,其单元晶胞通常由金属-介质-金属三层结构构成。通过金属的欧姆损耗和介质基板的介质损耗,超材料吸收器能够将特定频率处的电磁波几乎完全吸收。自超材料吸收器被提出以来,多种类型的超材料吸收器相继被提出,如单频段、双频段、多频段和宽频段吸收器,频率从微波延伸到了光频段。随着技术的进步和研究的深入,柔性的、频率可调谐和可开关的超材料吸收器因其在反射器