基于深度神经网络的短文本情感分类研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:m987987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据,人工智能时代推动了互联网社交媒体的革命,同时为网络文本高质量发展准备了条件。文本情感分析是自然语言处理的核心任务之一,其致力于通过对非结构化文本的上下文信息进行分析、学习、归纳等处理来提取情感语义特征,以便挖掘主观性文本中表达的情感倾向性。因此,如何从大量纷繁浩帙的信息中精确获取到文本内容隐藏的价值信息,是当今文本情感分析领域从事科学研究的中心环节。然而传统的文本情感分析主要面临两个挑战:一个是由于文本特征的选取容易受文本特征提取者意识主观性的影响,无法深入挖掘有效的隐藏信息;另一个是由于基于传统方法提取到的关键词无法有效建立重点关键词之间的属性关系,提取到的特征代表性不够高,形式过于简单。近几年,深度学习在包括自然语言处理等多领域取得了不错的成果。基于此,本文在基于深度学习的句子级别文本情感分析领域,整合目前主流的神经网络模型自身的优势与特点构造基于深度学习的融合模型,并在此基础上结合了注意力机制(Attention Mechanism)、主成分分析法(Principal Component Analysis,PCA),朴素贝叶斯分类器(Naive Bayes Classifier,NBC)等机器学习的方法,提出了两个模型:1.针对传统卷积神经网络提取文本情感特征较为单一,无法平衡好目前池化方法在特征向量维度过高和保留语义信息之间的矛盾关系的问题。提出了基于传统卷积神经网络和PSGD(Partial Sampling Gradient Descent)模型更新算法的CNNpbc模型(Convolutional Neural Network plus Bayes Classifier)。CNNpbc在池化层采用k-max+avg pooling的并行双池化操作进而更好地保留文本语义特征,模型通过PSGD算法保证训练过程的稳定性并提高了模型的收敛速度,提高分类的准确率。2.针对目前基于深度神经网络模型较为独立单一,无法充分聚合各模型自身优势同时未充分考虑关键词影响力因素的问题。将特定目标情感分析中对关键词的分析融入句子级别文本情感分类之中,提出了MATT-CNN+BiGRU融合模型。该模型利用注意力机制中的词向量、词性、位置三大要素来构建情感词向量嵌入矩阵。既能利用多注意力CNN对n-gram特征提取和目标关键词局部特征提取能力强的优势,又可以结合BiGRU模型结构相对简单并且可以兼顾文本的全局特征从而充分考虑词的上下文语义信息的优势,打破了长期以来单一模型发展局限性的枷锁,为句子级文本情感分析领域发展提供了一种新的思路。
其他文献
<正>算理和算法是计算教学中不可分割的两个方面,算理解决"为什么这样算"的问题,算法是算理的具体化,解决"怎样算"的问题。算理探究过程中的每一个步骤以及操作方法都是算法
期刊
目的探究护理干预对于预防下肢骨折手术后深静脉血栓的效果。方法将2017年6月—2018年9月这一时段内在该院进行手术治疗的下肢骨折患者96例纳入研究,按照住院号单双数,将之分
在移动互联网时代,移动端入口应用成为互联网发展的焦点。微信是国内用户流量最大的终端程序,旗下的微信小程序成为了一种全新的连接用户与服务的方式,是小个体商户建立自身互联网门户的最佳选择,但同时我们认识到,小个体商户存在专业性不足、开发能力欠缺、运维能力弱的用户特点,他们一方面渴望拥有属于自己的独立小程序,却无力付出相应的开发代价。于是,微信官方为了降低小个体商户拥有小程序的门槛,提出了微信小程序开发
近年来,APT攻击对政府、企业等大型机构的威胁不断增强。在检测到攻击后,需要通过取证分析来判定操作系统日志事件间的依赖关系,快速定位入侵点,并确定攻击造成的影响。但在实际场景中,大型机构往往需要存储PB级别的数据以满足取证分析的需求,这不仅带来了巨大的存储开销,还急剧增加了取证分析的运算和时间成本。因此,如何在不影响取证分析结果准确性的前提下,进行日志数据的压缩,是亟待研究的重要课题。目前,相关工
年幼时,我曾跟随父母,摸黑体验过宁海森林温泉。那时候,一大家子人只是在宁波南溪温泉疗养所里开了一个房间,根本没有泡的条件,只是匆匆洗了一回澡,倒是也记住了“温泉水滑洗