【摘 要】
:
随着科学技术发展,社会舆情的主要散播途径,已经逐渐从传统的线下平台转向了互联网平台,互联网已经逐渐成为了人们发表评论,抒怀胸臆的主要场所。因此,针对性的获取热点事件网络舆论,分析舆情走势,是极富有理论研究意义与实践意义的。深度学习技术作为当下最热门的机器学习技术,在多个应用领域内取得了突出的成果,尤其在自然语言处理相关的研究工作中,基于深度学习设计出的模型已经可以在一些评估项目中胜过人类。本次研究
论文部分内容阅读
随着科学技术发展,社会舆情的主要散播途径,已经逐渐从传统的线下平台转向了互联网平台,互联网已经逐渐成为了人们发表评论,抒怀胸臆的主要场所。因此,针对性的获取热点事件网络舆论,分析舆情走势,是极富有理论研究意义与实践意义的。深度学习技术作为当下最热门的机器学习技术,在多个应用领域内取得了突出的成果,尤其在自然语言处理相关的研究工作中,基于深度学习设计出的模型已经可以在一些评估项目中胜过人类。本次研究将尝试使用深度学习技术对网络舆论进行分析与预测,力图提高舆论分析工作效率,提升舆情走势的预测准确率。
网络舆论分析与预测工作内容主要分为两部分,首先需要将舆论按其情感正负倾向进行分类,从而完成舆情的分析工作;然后需要根据历史时间节点舆论正负情感的比例,对未来舆论情感变化进行预测。网络舆论通常以序列型的文本呈现,对时序与上下文的相关性依赖程度较高,因此在本次研究工作中,使用基于循环神经网络的相关模型进行研究与分析,具体工作如下:
提出了一种基于长短期记忆网络(LSTM)的改进结构快速长短期神经记忆网络(RLSTM)用以提高分类模型的训练效率,结合该结构设计了4种文本情感分类模型,并对每种模型的训练与使用过程进行详细的设计。同时设计了基于门控循环单元网络(GRU)的舆论走势预测模型,并通过多个分类维度,结合虎扑论坛的特点,评估该模型实际效果。最后设计了完整的舆论分析与预测服务架构,实现了高效准确获取舆论数据的爬虫模块,构建了自动化的数据预处理组件,并通过数据可视化工具,将相关话题的舆论走势进行展示。
结果表明,改进LSTM结构与组合复合型分类模型有效的提高了文本情感分类模型的训练效率与分类准确率,同时舆论倾向走势预测模型也具有较高的可靠性。本文通过将上述两类模型进行组合,成功构建了一套完整的舆论分析与预测服务平台,完成了针对虎扑论坛热点事件舆论的分析与预测工作。
其他文献
暗物质的存在已经被宇宙学研究与天文学观测所证实。作为当今物理学界的前沿,国内外许多实验组已经开展了一系列的探测实验,然而从“暗物质”概念的提出到现在已有80多年,这些实验还未探测到暗物质,人类对暗物质粒子的本质也仍然一无所知。 探测暗物质粒子的方法通常分为对撞机产生、直接探测和间接探测。其中直接探测实验需要严格抑制本底事例,搜寻在统计上超出本底事例的暗物质与普通物质相互作用的散射(核反冲)信号。
气体探测器是现代粒子物理实验中不可或缺的测量装置。近年来,随着技术工艺的进步以及物理实验需求的提升,微结构气体探测器(Micro Pattern Gas Detector,MPGD)得到了广泛的研究与应用,其中典型的代表是微网结构气体探测器(MICRO-Mesh-GASeous-structure,Micromegas)和电子倍增器(Gas Electron Multiplier,GEM)。因为空
以石墨烯为代表的二维材料具有独特的二维层状结构,表现出优异的物理、化学等特性,在光通信、光传感、生物医学等众多领域具有重要应用潜力。特别的是,由于二维材料独特的电子结构,伴随入射激光强度的增加,其表现出独特的超宽波段、超快响应等优异特性,已经成为非线性光学和激光技术等领域的研究热点。 非线性光学材料在激光物理领域占有非常重要的地位。在非线性光学器件中,寻找高阈值、宽带响应的非线性光学材料一直是其
随着无线通信的迅速发展,基于位置的服务(LBS)业务需求也不断壮大。在室外等开放场所,全球定位系统(GPS)因能实现高精度、高可靠性的LBS而得到广泛应用。然而在人类活动更加频繁的室内场所,由于建筑物阻挡等原因,GPS很难提供准确的位置信息。这些年来,室内定位得到广泛关注,各种室内定位方法也是层出不穷。现有的室内定位方法,根据不同的技术类别,可分为声学、光学和射频(RF)等方法。 由于RF信号可
随着移动互联网的飞速发展,人们对于消费电子类产品的需求越来越高,因此,对于芯片的性能和功耗提出了更高的要求。然而,由于受到工艺、电压和温度(Process、Voltage、Temperature,PVT)等偏差因素的影响,在数字集成电路设计阶段需要为芯片预留充足的时序余量,以保证芯片在最差条件下仍能正确工作。同时,当芯片工作于低电压下(如近阈值区)时,芯片受PVT的影响加剧,导致预留的时序余量进一
石墨烯具有高载流子迁移率、宽带吸收、透明等属性,使其成为一种极具发展前景的光电材料,可用于开发高速可调的CMOS兼容硅基光源和调制器。本课题针对石墨烯的电光可调特性做了深入研究,并以此为基础在电吸收调制器、纳米天线增强硅波导调制器以及高速可调的MIS隧穿光源等方向开展了系统的研究工作。研究的主要内容及创新点可以概括为以下几点: 1.提出了一种新型的混合SPP波导调制器,与传统SPP波导调制器相比
钙钛矿型的(Ba,Sr)TiO3(BST)薄膜,因为其相变温度可以根据不同器件特定的温度需要进行调节,在铁电材料中一直是研究的热点,特别是集成铁电薄膜器件及其相关的物理问题方面在目前获得了极大的关注。本论文主要是利用射频磁控溅射法,在不同衬底上,制备BST薄膜的异质结构,并通过选取合适的电极、加入过渡层、以及掺杂的工艺,以实现薄膜微观结构的控制、改善薄膜的质量,提高BST薄膜的光电性质。这些实验结
长余辉发光材料是一种关闭光源后仍能持续长时间发光的新型功能材料,被广泛应用于紧急照明、军事和工艺美术等领域。但红色长余辉发光材料的欠缺在一定程度上抑制了长余辉发光材料的应用,所以发光性能较好的红色长余辉发光材料的研制是扩大长余辉发光材料应用领域的关键。而Sr3Al2O6:Eu2+,Dy3+作为一种新型的红色长余辉发光材料,具备铝酸盐长余辉发光材料的优良特性,越来越受到人们的重视。本文采用传统的高温
JPEG2000是由联合图像专家组为静态图像编码所批准的一个新的国际标准.它不仅能提供优于现行标准的率失真特性和主观图像质量,且能提供现行标准不能有效或完全不支持的特性和功能.在这个标准里,采用了小波变换、提升方案和EBCOT(embedded block coding with optimizetruncation)算法.由于这些算法的应用,JPEG2000能提供许多特性,诸如感兴趣区域(ROI
拷贝数变异作为一种重要的基因组结构变异,包含大量的基因信息,在人类遗传病、肿瘤及罕见病等复杂疾病中扮演重要的角色。针对不同样本场景(多样本、配对样本和单样本)的拷贝数变异,其研究意义也略有差异:检测多样本中共同拷贝数变异有助于研究物种的群体遗传学特征;检测患病配对样本的拷贝数变异对研究肿瘤等疾病的发生、发展机制及靶向药物治疗等具有重大的意义;另外,在缺乏对照样本时,检测单样本中拷贝数变异可为寻找罕