基于异构数据和神经网络的舆情分类技术研究

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:lkm6839257
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的发展,舆情数据的发展趋势呈现出爆炸式增长。网络上充斥着巨量的图片、语音、文字等各种类型的数据信息,这些越来越复杂的网络数据相互结合,构成了一个复杂的数据结构来表达数据的信息。在舆情数据中,通过单一类型的数据(图片、文本、语音等)越来越难以完整的表达数据信息。近年来,神经网络在面对各类数据信息,通过特有的层次结构将数据信息从低层特征空间提取到高层特征空间,在各类数据分类及物体识别等相关应用中取得了重大进展。神经网络在各类数据和各研究领域中展现出的宽泛适用性,为本文的信息融合提供了有力支持。对于一个包含多种类型数据的网络舆情信息,本文提出一种新的舆情分类模型,通过神经网络模型分别去学习不同类型信息的数据特征,对它们的特征融合后进行分类,通过这种方法实现数据信息更好地分类。在实验中,本文分别使用LSTM和CNN神经网络提取文本和图像数据特征,对二者特征融合后进行分类。结果证明,多种类型的数据特征进行融合后再分类,可以更好地实现对网络舆情数据信息的分类,提高了舆情信息分类的准确性。在前人基础上,本文提出的改进主要有以下三点:(1)根据对不同类型数据特性的分析,采用不同的神经网络模型,以构建各类型数据的特征提取模型。(2)面对训练好的特征提取模型,首先要考虑的是将不同模型训练得到的各类型数据特征,将之提取到相同的特征空间来进行特征融合。(3)为了进一步提高分类器的性能,本文使用了权重来对不同的数据特征来进行特征融合。
其他文献
超声波测距传感器(本文也简称为声纳)以其价格低廉、硬件容易实现、测距相对准确等优点,已成为移动机器人感知环境信息必不可少的一种传感器。为了获取更多的周围环境信息,通
急性心肌梗塞(AMI)是临床急诊常见的急性多发病,正确诊断及时救治对挽救濒死心肌、改善预后、降低急性期病死率和死亡率具有重要意义。在AMI的生化诊断方面,肌酸激酶(CK)及其
从CES2019众多彩电企业“抢滩”8K市场来看,8K电视或许迎来了大规模上市的真正元年。但与许多彩电企业正式开始布局8K领域相比,夏普早已先行一步,在2015年便正式商品化,目前
2006年9月,国家颁布了《“十一五”时期文化发展规划纲要》,将加强“公共文化服务”作为下一步文化建设的重要组成部分,这是国家首次明确提出“公共文化服务”的概念。这一概
在经济全球化的时代,国际间的经贸往来比以往任何时候都更频繁和活跃。在国际商务中,商务英语谈判对商务活动的成败起着关键的作用,恰当的语言技巧能使谈判顺利进行,取得较好
案情介绍民国北京政府时期,发生了一起美商起诉商务印书馆侵犯其版权和商标权的案件,基本案情如下:美商米林公司在美国出版发行了《韦氏大学字典》。自1919年至1923年间,上海
贫困问题一直是我国发展进程中的重点关注问题,在党的十九大报告中也提出了2020年全面实现小康社会,关于扶贫、扶贫资金和扶贫资金审计的理论研究实现农村贫困人口全面脱贫,消除绝对贫困,确保贫困县全部摘帽,解决区域性贫困问题。而要想实现全面脱贫,必定离不开国家扶贫资金的大力支持,我国从改革开放以来实施救济式扶贫、到以工代赈式扶贫、开发式扶贫、对口扶贫、以至今天的精准扶贫,国家已经累计投入数千亿元用于解决
复句作为语法单位的重要组成部分之一,不仅是学术研究的重心,也是教学中重点讲解的内容,纵观现代汉语复句的研究历史,对于复句关系分类研究的热度始终无法退却,由此可见其研
随着移动用户的迅速增加,以及人们对多媒体移动通信的需求增加,通信频谱资源变的更加稀有可贵,为了更好的利用频谱资源,LTE系统舍弃浪费资源的软切换技术,采用硬切换,同时又
【正】 北京话表动作时间短暂、含尝试意义的动词重叠式(如:看看、讲讲、考虑考虑),在贵阳话是在动词后面加“下”来表示。比如:“你看下书再走”。贵阳话单音节动词有附加词