【摘 要】
:
文本情感分类主要分为基于规则和基于统计,其中基于统计的文本情感分类以深度学习方法为主.但是深度学习高度依赖于大量高质量的训练数据,而现实生活中没有大量的训练数据.基于规则词典的文本情感分类又依赖于情感词典的准确度.所以本文提出了一种基于统计的Bert和卷积神经网络和双向长短时记忆(BILSTM)的混合神经网络结构加基于规则词典的BAGGING的方式进行情感判别.经过试验证明,结合规则与统计的方法与单独使用词典和单独使用Bert相比,准确率有所提高.
【机 构】
:
沈阳化工大学计算机科学技术学院 辽宁 110142
论文部分内容阅读
文本情感分类主要分为基于规则和基于统计,其中基于统计的文本情感分类以深度学习方法为主.但是深度学习高度依赖于大量高质量的训练数据,而现实生活中没有大量的训练数据.基于规则词典的文本情感分类又依赖于情感词典的准确度.所以本文提出了一种基于统计的Bert和卷积神经网络和双向长短时记忆(BILSTM)的混合神经网络结构加基于规则词典的BAGGING的方式进行情感判别.经过试验证明,结合规则与统计的方法与单独使用词典和单独使用Bert相比,准确率有所提高.
其他文献
随机搜索法是对无约束力问题寻找最优解的一种算法.随机森林是一种集成算法,为了提高随机森林分类的准确率,需要对参数进行调参.随机森林可以通过网格搜索算法或学习曲线算法选取到合适的参数,但是训练时间过长,消耗资源过大.本文通过对随机搜索算法改进,利用改进的随机搜索算法优化随机森林调参.经过实验验证,改进的算法选取到的参数保证了随机森林分类准确率的同时,相较于通过学习曲线算法缩短了约百分之六十的调参时间.
本文结合威胁情报系统的设计、开发和运维经验,系统研究了流式数据处理、交互式数据分析、数据湖以及分布式数据处理等大数据技术在威胁情报系统中的应用.分析和总结了在威胁情报系统建设场景中,大数据技术的选择、大数据产品的选型以及大数据平台的设计,为基于大数据技术的应用系统的设计和开发提供参考.
在信息技术发展速度逐渐加快的背景下,计算机软件在人们日常生活中得到了广泛的运用,软件创新研发得到了人们的重视.在此背景下,人们的工作、生活方式发生了巨大的转变,加强了科技感.在计算机软件开发方面,分层技术为其提供了强大的技术支持,能够有效地解决软件开发过程出现的缺陷问题,充分发挥出软件功能,不断提高经济效益,促进社会的发展.
高斯混合模型是一种含隐变量的概率图模型,其参数通常由EM算法迭代训练得到.本文在简单推导高斯混合模型的EM算法后,将使用高斯混合模型对鸢尾花(iris)数据集进行分类判别.同时,针对EM算法受初始值影响大的问题,使用了K均值聚类算法作为其初始值的估计方法.在得到K均值聚类算法和EM算法的分类判别结果后,对比两种算法的判别准确率,以此说明在初始值合适的条件下,基于EM算法的高斯混合模型具有较高的准确率.最后文章分析指出了当前EM算法的两个局限性:易受初始值影响和维度灾难.
针对态势要素提取问题,提出了一种基于近似信息熵改进随机林的网络安全态势要素提取方法.首先,属性的重要性由近似信息熵约简取得.再使用随机森林分类器对处理后的数据进行分类.最后,为了验证算法的有效性,通过入侵检测数据集测试改进随机森林算法性能.实验结果表明,该算法对比传统随机森林有效地提升了准确率,提高了网络安全态势要素提取水准.
为提高数字图像面对攻击时的鲁棒性,本文提出了一种基于二维经验模态分解(BEMD)的灰度水印鲁棒算法.首先在水印嵌入前对其进行Arnold变换,在没有密钥时无法获取正确的信息,提高了水印的安全性.其次在水印嵌入过程中,由于BEMD分解有效将宿主图像划分为不同频次的内蕴模态函数,通过不可见实验测试我们选择将水印信息嵌入到人眼不易识别的频次,对水印的不可见性有了很大的提高.最后实验测试了本文算法在面对裁剪、椒盐噪声、缩放、旋转等攻击时,相关性指数(NC值)均在0.97以上,有着较高的鲁棒性.
在当前时代背景下,大数据在生活中的运用仍是一把双刃剑,计算机网络安全也面临着严峻的考验,所以,人们在享受大数据所带来的便利的同时,还应该注重计算机网络安全,树立较高的防范意识,合理地采用相应的举措,尽可能地降低计算机网络安全风险.基于此,本文首先分析了大数据的概念及特点,接下来从两个方面简单分析了大数据背景下计算机网络安全隐患,最后从三个方面重点分析了基于大数据时代的计算机网络安全防范措施,供相关人士参考.
伴随着互联网的快速发展、媒体资源数字化进程的不断加快,数字产品(如图片、音频、视频等)的版权问题日益凸显,掀起了数字水印的研究热潮.本文主要实现一种基于DCT的数字水印算法,并根据此算法在可靠性方面的特性进行测试总结.将原始图片分割成8×8的子块,对各子块进行DCT变换,并在原始图片的每个子块的DCT系数的中频位置,按照上述算法利用水印给图片添加“标记”.通过大量的仿真实验对此水印算法的性能进行评估,利用客观评价体系对水印图片进行测试,结果表明此水印算法在抵抗压缩、低通滤波等攻击方面时都表现出较强的鲁棒性
本文针对工业控制领域中控制器安全运行的问题,进行了控制器内置程序安全启动方面的研究,提出了采用SHA-256安全哈希算法对控制器内置程序进行校验的程序完整性检查方法.本文提出了控制器程序的安全可信启动系统架构,给出了基于SHA-256哈希算法的校验处理流程,并在控制器上进行了实际的效果测试和验证.验证试验表明,本文提出的可信启动方法能够有效检测出控制器程序内容的篡改破坏情况,具有极高的灵敏度,能够保证控制器程序的可信安全启动.
B站的诞生打造了一个由用户自发组建和养生的生态系统,丰富了人们的生活,其中强大的弹幕互动信息以及视频评论透漏出用户自己的价值观和文化多样性.本文针对其中的视频评论进行情感分析,主要是判断其中的情感倾向,即正面情感、负面情感和中性情感的判断.本文在原有的基础情感词典的基础上,对B站领域的情感词进行汇总和整理,构建出领域情感词典,并运用SO-PMI算法进行其中的情感倾向计算,实现了一个面向B站领域情感倾向分类系统.实验数据来源于数据堂,针对抗击肺炎专栏中的要点聚焦视频评论进行分析,由志愿者进行人工标注后进行实