基于深度学习的网络文本情绪分类研究

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:c42865
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的普及与发展,越来越多的使用者通过网络发表信息和交换个人意见,造成了网络中信息数据的爆炸式增长。由于网络的开放性和包容性,大量的信息充斥在网络环境中,实时监测网络环境,分析网络信息的情绪倾向,对维护网络的内容安全具有重大的意义。但通过人工的方式对如此庞大的数量级的信息进行处理分析是完全不可能实现的,而一般的数据处理及分类技术如关键词过滤等,虽然可以解决样本处理的效率问题,但由于语言表达方式的复杂性,并不能保证样本分类的精度。本文结合了安全和智能这两个当前计算机领域的重要研究方向,针对处理网络大量数据的内容安全问题,利用自然语言处理的相关技术,采用深度学习模型,通过利用神经网络模型对文本样本进行训练学习,根据样本的情绪倾向进行分类,实现对大量网络文本信息的高效处理。由于长短期记忆网络(LSTM,Long Short-Term Memory)在处理时间序列和延迟相对较长的任务方面所具有的优势,使得它在许多深度学习的相关领域得到了充分的应用。针对当前网络环境中越来越多样化的意见表达方式以及爆炸式的信息增长速率,本文提出了一种基于多维度LSTM的网络内容安全文本分类模型。该模型可以充分利用样本的附加信息,以提高分类的精度。在本篇论文中,将原始样本处理成主要信息样本和附加信息样本,并利用多维度LSTM分类模型分别提取两类样本的特征向量。最后进行特征融合,根据分类器的计算结果确定样本情绪类别。本文利用Tensorflow对该模型进行了仿真实验,并对实验结果进行了分析,实验结果证明多维度LSTM模型对分类精度的提高有较大的积极作用。
其他文献
白菜、甘蓝和甘蓝型油菜等作物作为我们国家北方最常见的蔬菜和油料作物,非生物胁迫例如干旱、高盐等都对作物的质量和产量都造成非常严重的影响。ABA(Abscisic acid)即脱落
学位
生存分析是当今热门的统计学分支,它是分析生存现象和响应时间数据及其规律的一类统计分析方法。生存分析的研究通常是针对所研究的事物建立相应的模型,通过数据特征进行生存
由于风险投资中存在着高度不确定性和严重的信息不对称,这会产生风险投资家(VC)和风险企业家(EN)之间的委托代理问题,能否有效解决这些问题将直接关系到风险投资的成败,因此,制定合理的契约机制是保证风险投资顺利进行的核心。在此背景下,我们基于原有的研究对风险投资委托代理模型进行了改进设计。首先,我们构建了一个基于EN管理努力与创新努力视角下的基础模型。通过分析我们认为,VC通过改变EN激励系数来影响
随着全球经济和资本市场的蓬勃发展,股权质押作为一种新的融资方式越来越受到大股东的青睐,股权质押是指出质人以其所拥有的股权作为质押标的物而设立的质押,在质押过程中,股东在将股权价值变现的同时仍然保留了控制权,并因此受到了广大股东的欢迎。然而,股权质押并非是毫无缺陷的,不仅会使得控制权和现金流权分离,这种两权分离构成了掏空的诱因,并在能够使控股股东保有控制权的情况下方便的使用其他掏空手段进一步实施利益
近年来,船舶污染物的排放问题受到越来越多的关注。船舶排放是主要的大气污染源之一,船舶排放的大气污染物中,主要包括氮氧化物、硫氧化物和颗粒物等。设立船舶排放控制区(Em
随着三维建模和三维扫描技术的不断成熟,三维模型的获取变得越来越容易。相对于平面的二维图像,立体的三维模型能够给人更直观的视觉感受,符合人类的认知习惯,被广泛地应用于
自我国改革开放以来,国民经济飞速发展,我国职业体育也随之迅速发展,职业体育作为体育经纪行业的根基与土壤,其良好的发展势态也标志着我国体育经纪行业进入了新的发展时期。
21世纪是大数据的时代,计算机技术飞速进步,数据的获取和储存都变得十分便利,数据的数量和形式都不可同日而语,很多部门每天都有巨大数量、不同形式的数据产生。大数据是由主体、来源和形式都不同的数据合并而成,不同数据集由于数据来源不同,彼此之间存在一定的差异性,但研究同一课题时,同样的解释变量和被解释变量在不同数据集之间又存在一定的关联。正是因为大数据具有数据来源差异性、高维性及稀疏性等特点,在对于多个
对大肠杆菌等平台生物的代谢途径进行改造,积累有用代谢产物是现代发酵工程和合成生物学的核心内容。启动子是基因调控和代谢途径改造的重要调控元件,通过改变启动子的启动活性可以调控目的基因的转录水平以积累代谢产物。本实验室的前期工作用鸟枪法从小球藻病毒基因组随机片段中筛选到一组小球藻病毒强启动子N63,N37,N40;利用RT-qPCR检测了这些启动子控制下的报告基因转录文本丰度,用RACE-PCR确定了
可交换债券的起源要追溯到上世纪70年代的美国,此后四十多年里,可交换债券在欧美、日本等发达地区已经得到了蓬勃的发展,形成了较为完整的体系,然而在我国,可交换债券仍然处