【摘 要】
:
随着互联网用户的逐渐增多,各种网络平台的信息量也越来越大,处理大量可用信息是一项超出人类处理能力的艰巨任务。这些信息具有巨大价值,所以一个高效的情感分类算法具有一定的理论意义与应用价值。然而,虽然在英语情感分析方面已经有人做了大量的工作,但在中文领域的研究却相对较少。另外在特征工程、上下文关系以及一词多义方面,情感分析还存在相当大的挑战。基于此,本文提出了一种基于权重融合BERT结合改进的胶囊网络
论文部分内容阅读
随着互联网用户的逐渐增多,各种网络平台的信息量也越来越大,处理大量可用信息是一项超出人类处理能力的艰巨任务。这些信息具有巨大价值,所以一个高效的情感分类算法具有一定的理论意义与应用价值。然而,虽然在英语情感分析方面已经有人做了大量的工作,但在中文领域的研究却相对较少。另外在特征工程、上下文关系以及一词多义方面,情感分析还存在相当大的挑战。基于此,本文提出了一种基于权重融合BERT结合改进的胶囊网络的情感分类网络模型FuBERT-Caps。由于BERT网络可以捕捉语言结构信息,但其仅仅使用最后一个编码层的输出特征用于分类,忽略了其他层学习到的语义特征。另外,胶囊网络(CapsNet)是对卷积神经网络的一种改进,克服了 CNN空间不敏感的缺点,并且可以捕捉单词的位置信息。因此,本文提出的FuBERT-Caps通过对BERT多层表示的动态权重融合(FuBERT),来对输入序列进行嵌入,生成全局的特征表示,以用来提高词嵌入的表达能力。然后利用胶囊网络和动态路由算法提取文本序列的局部和空间层次关系,并给出其局部特征表示,最后通过Softmax分类器进行分类。综上所述,本文提出的FuBERT-Caps模型不仅可以解决情感分类任务特征工程等问题,还可以可以提高情感分类的准确率。实验结果表明,在给定的基准数据集上,该模型达到了 95.64%的基准准确率,比BERT模型提高了近1.1个百分点。
其他文献
具有交替排列贝氏体/铁素体组织的新型片层结构低合金TRIP钢强塑性优异,合金成本低,生产工艺简单,是解决汽车工业日益增长的轻量化及高安全性需求的方案之一。但片层结构低合金TRIP钢双相区组织特征对贝氏体相变行为和强塑化机制的影响,热处理工艺参数对片层结构低合金TRIP钢组成相含量配比和强塑性的影响尚不清楚。本论文以低合金TRIP钢为研究对象,通过热膨胀仪、背散射电子衍射技术、准原位X-射线衍射、基
中华民族共同体意识是赋予意义和蕴含价值属性的集体记忆,具体表现为族群想象的共同体、通过符号再现的共同体、接受文化滋养的共同体和嵌入价值评断的共同体。嵌入价值评断的分析,赋予中华民族共同体意识全新的认知结构。文章在厘清中华民族共同体意识的内在逻辑的基础上,提出铸牢中华民族共同体意识的集体记忆要把握四重向度,分别是中华民族共同体意识的价值的确立与重塑、内容生产与再生产、符号的表达与强化、文化的滋养与认
本文对中成药脑灵素片进行了一年的留样观察,并作了分析。认为脑灵素片在室温存放一年后,基本上不影响片剂的外观、崩解时限和卫生标准。
煤炭、煤系气、煤制油气和煤基新材料是中国能源安全稳定供应和经济社会发展的有力保障.以煤炭为主的资源禀赋和经济社会发展阶段,决定了煤炭资源在中国能源体系中的重要地位.煤系矿产包括有聚集或分散的固态、液态、气态多类型能源、金属和非金属矿产,是地球多圈层相互作用和成矿物质形成、运移和聚集的产物.煤系记录了海陆过渡相和陆相泥炭沼泽丰富的深时地质信息,是揭示表生生态系统演化、巨量有机碳埋存、大气O2/CO2