【摘 要】
:
随着信息时代的到来,越来越多的人们开始热衷于在社交网络上发表自己的言论,这使得全球信息呈指数级的增长。如何从这些信息中提取出人们的情感倾向成为一个亟待解决的问题。正是在这种环境的驱使下,情感分析技术应时而生,其广泛应用于商品评价、舆情分析、推荐系统等领域,具有很高的研究和应用价值。情感分析技术中的关键在于情感分类模型的构建。传统的情感分析方法是基于情感词典的方式,这种方法非常依赖于情感词典的构建,
论文部分内容阅读
随着信息时代的到来,越来越多的人们开始热衷于在社交网络上发表自己的言论,这使得全球信息呈指数级的增长。如何从这些信息中提取出人们的情感倾向成为一个亟待解决的问题。正是在这种环境的驱使下,情感分析技术应时而生,其广泛应用于商品评价、舆情分析、推荐系统等领域,具有很高的研究和应用价值。情感分析技术中的关键在于情感分类模型的构建。传统的情感分析方法是基于情感词典的方式,这种方法非常依赖于情感词典的构建,同时模型的泛化能力不高。随后,利用朴素贝叶斯、支持向量机等机器学习算法来构建分类器,虽然取得了一定的成果,但是这些方法不能提取深层次的语义信息,且训练较为困难。深度学习的发展给情感分析技术带来了新的契机,本文借鉴了深度学习的相关算法,对现阶段情感分类模型存在的问题进一步优化,其研究内容如下所述:(1)从词向量的角度出发。目前应用最广泛的词向量表示为Word2Vec词向量、Glove词向量,虽然这两种词向量表现出不错的效果,但是它们存在不能解决一词多义的缺点。文本借鉴了 BERT预训练语言模型,因为该模型在训练的过程中,采用随机Mask部分单词的策略,模型通过学习上下文信息来预测被Mask的单词,同时,在词向量的基础上,又拼接了单词的位置向量和句对向量来共同作为嵌入层的输入向量表示,解决了一词多义的现象。随后通过词向量的对比实验,验证了采用BERT词向量的方式能够提升模型的分类性能。(2)针对RNN网络无法并行化训练的缺点,同时进一步提升模型的性能,本文提出了一种基于多头自注意力的双向切片神经网络模型。该模型借鉴了切片神经网络的特点,通过对原始序列进行切割的方式,每一个切割后的子序列都能够并行化的训练,减少了模型的训练时间,同时,在模型的内部添加多头自注意力机制,其能够学习到不同子空间中的隐藏信息,提取序列中单词之间的联系。通过对比实验可知,本文提出的模型在保证一定的分类准确率下能够明显提升模型的训练速度,验证了本文模型的有效性。
其他文献
影响区域创新的两大重要因素分别是区域创新投入,和区域之间的创新空间溢出。事实上,创新资源和要素的空间分布极不平衡,大部分区域无法仅依靠自身投入来增强区域创新。在创
工业生产中较为传统的采样方式是均等时间间隔的均匀采样,即单采样率系统采样,而单采样率系统理论已经非常成熟,但是在现代工业的生产过程中,都会涉及到多种传感器的配合使用
5G作为下一代移动通信技术,需要在现有的基础上大幅度提升传输速率、系统容量并且降低通信时延,保证传输可靠性。在当前可用频谱资源日趋紧张的情况下,大容量MIMO技术能够有
作为老百姓亘古不变的期盼,平安是各级地方政府必须提供的最基本的公共产品,更是民生需求最基本的体现。要想实现乡村振兴工作,首要做好平安建设,平安建设是乡村振兴的重要保障。当前,我国基层面临各种治理问题和矛盾危机,突出表现为自然资源短缺、人居环境条件恶化、基层公共事务衰败、基层公共服务短缺等诸多问题。因此,需要加大平安建设投入力度,采取更加主动、积极的方式维护社会和谐稳定,才能够实现全面深化改革,更好
青岛基层组织建设经验丰富,叫响全国的“莱西经验”就是以加强村级党支部的领导核心为重要内容,新时期深化拓展莱西经验,需要不断加强村级党支部的引领和带动,而党支部的作用发挥如何关键在人,即党员干部的先锋模范、带头作用的发挥。新形势下,需要不断探索运用新方式、新手段加强对党员干部的教育,为农村党支部培养靠得住、顶得上的好干部。《2019—2023年全国党员教育培训工作规划》中要求创新运用信息化手段,推动
随着移动互联网的兴起,社交网络的发展如火如荼,在国内,以微信、新浪微博为代表的社交产品开始占用人们越来越多的碎片化时间。微博的两种社交规则使其成为一个具有信息集散
纹理图像中重复纹理元素的提取是指将组成纹理图像的具有相同或相似特性的重复单元(即纹理元素)的数据结构提取出来。重复纹理元素提取的目的是识别纹理图像中具有相似视觉特
跨语言层次分类体系匹配是为一种语言的层次分类体系中的每个分类识别其在另一种语言的层次分类体系中最相关分类的一项任务。它是实现跨语言知识共享与融合的重要途径,也是
文本表示算法的研究意义重大。目前常用的两种文本表示算法是以词袋模型为代表的统计语言模型和概率神经语言模型,然而统计语言模型和概率神经网络为代表的文本表示算法都有
在线社交网络(OSNs-online social networks)的发展与普及给人们的日常生活带来了极大的便利,如今每天有多达数十亿的用户活跃在OSNs上,产生了大量的社交信息。渐渐地,人们将