基于深度学习的Webshell检测算法的研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:tzflz108
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,互联网已经与人们的生活密不可分,各类网络应用层出不穷,给人们的生活带来了极大的便利。与此同时,网络攻击事件越发频繁,网络安全也逐渐受到重视。Webshell恶意脚本具有灵活多变、隐蔽性强等特点,因此,在网站后台中植入Webshell恶意脚本成为了攻击者最常用的手段之一。本文致力于解决Webshell检测模型在特征提取过程中未考虑Webshell文本数据语义信息导致特征挖掘不充分而影响分类效果问题,为了提升Webshell检测模型的准确率,提出了基于深度过参数化卷积(DO-Conv)的改进文本卷积神经网络(Text CNN)算法,并使用Bidirectional Encoder Representation from Transformers(Bert)模型进行预训练。本文的主要工作如下:(1)针对当前Webshell特征挖掘过程中,未考虑数据集文本语义信息导致特征挖掘不充分的问题,论文中提出了使用Bert预训练模型动态表征词向量的方法,通过搭建Bert预训练模型,将输入的文本数据分为词汇向量、文本向量和位置向量,从词汇级语义信息、句子级语义信息和语序三个方面动态的表征词向量,充分挖掘文本数据的语义特征,同时还搭建了Word to Vector(Word2Vec)和Global Vectors for Word Representation(Glo Ve)两种预训练模型,在三种预训练模型下游均接入Text CNN模型,根据最终的分类准确率进行对比实验,实验表明使用Bert模型动态提取Webshell特征可以有效提升模型的分类效果。(2)针对Text CNN模型结构简单,参数数量少,且收敛速度快,导致模型因在训练过程中不能充分学习到文本数据中的全部特征而影响模型分类效果的问题,论文中提出了一种基于DO-Conv的改进Text CNN算法,使用DOConv层替换原先模型中的卷积层,从而增加模型在训练过程中可学习参数量,降低收敛过程的误差,提高模型的准确率,与一些常见的机器学习模型和深度学习模型进行对比实验,验证了改进Text CNN算法的有效性。该算法在PHP数据集上得到的准确率为99.25%,精确率为98.77%,召回率为99.06%,f1值为99.38%;在ASP数据集上得到的准确率为98.21%,精确率为97.22%,召回率为99.06%,f1值为98.13%;在JSP数据集上得到的准确率为98.96%,精确率为98.04%,召回率为99.24%,f1值为99.01%。实验结果表明,本文设计的改进算法与其他几种算法相比,在PHP、ASP和JSP三类数据集上均有不同程度的提升,有效提升了模型的分类效果。
其他文献
高等职业教育在我国经历了长达百余年的发展历史,随着社会发展的变革,我国高等职业教育体系在国家政策的调控下不断完善。2019年4月30日,国务院常务会议讨论通过了《高职扩招专项工作实施方案》,要求高职院校实施“质量型扩招”,这项政策对推动高职教育的发展具有十分重要的现实意义。本研究以有限理性决策理论和史密斯政策执行过程模型为理论基础,以高职院校质量型扩招政策为研究对象,梳理质量型扩招改革背景及其政策
学位
2014年习近平总书记在索契冬奥会上首次提出“如果冰雪项目能在关内推广,预计可以带动两三亿人参与”,2015年国家体育总局在新闻发布会中提到,总局正在为实现“三亿人上冰雪”思考和布局,随后教育部联合四部门颁布《关于加快推进全国青少年冰雪运动进校园的指导意见》,意见提出,到2020年我国遴选出2000所冰雪特色学校,这是教育部发展青少年冰雪运动的战略布局,这为新疆冰雪特色学校的发展提供了前所未的机遇
学位
辽河油田储气库建在砂岩油藏,由于高压天然气的强注和强采的原因,储气库将面临气井出砂的风险,导致套管损坏、砂埋气层、气蚀管线和设备等生产事故的发生。辽河油田前期针对此类气井的出砂机理和防砂技术未曾开展系统化研究。因此,急需开展高压气井防砂技术研究。辽河油田前期并没有日注采量达到几十万方的气井,而储气库建设是实现辽河油田长远发展目标“建设双千油田”的重要工程。本文通过对辽河油田双6储气库地质情况、出砂
学位
班主任是教师群体的重要组成部分,承担着一个班级方方面面的事务,在政策层面也被给予了较多的关注。关于班主任的工作定位,尽管有相关文件可以做参考和标杆,但在实际的执行中,班主任的角色已然发生了很大的变化,有与时俱进的合理角色定位,也不乏角色范围不明带来的角色偏差与错位,需经过科学分析后加以厘清,清除班主任专业发展中因角色定位不当造成的外在障碍,激发班主任内在活力与工作内驱力。本研究运用教育叙事研究的方
学位
长期以来,教师反馈在高中英语写作教学过程中是一种不可或缺的手段。国内外也有不少学者针对写作教师反馈做出了大量研究,但对于高中学段英语写作教师反馈方式的国内研究相对甚少。为深化高中英语写作教学研究,探索出适合高中英语教师对高中学生写作反馈的具体方式与策略,本调查研究项目主要针对高中英语教师写作反馈的以下几个问题展开:1)高中英语教师在日常教学过程中的对学生写作反馈现状如何?2)学生对当前高中英语写作
学位
新冠肺炎疫情催生的“隔离经济”下,社交电商取得了爆发式增长。社交电商利用人与人之间形成的复杂关系网络传播商品信息,把用户引流到社交电商平台。社交电商中用户关系的远近影响着消费者对商品信息的信任程度以及消费者的转发、购买行为。因此,研究社交电商中关系强度对信息传播与购买行为影响具有理论意义和现实价值。本文基于社交电商环境,分析了商品信息传播过程中的主要特点,提取出影响用户分享、购买行为的个人内在因素
学位
随着市场经济在高等教育领域的逐步扩散,高校办学规模不断扩大,国际间教育交流日趋频繁,高等教育进入普及化阶段。适龄学生接受高等教育的途径日益增多,民办高校间的竞争愈演愈烈。优化创新招生策略,吸引优质生源报考,已经成为各民办高校招生工作中尤为重要的一环。本文结合作者在高校的工作实践,以河南A民办高校为研究对象,基于营销学理论体系架构,对该校的招生策略进行系统地分析和深入地探讨。首先,阐述了论文研究的背
学位
劳动是创造物质财富和精神财富的过程,是人类特有的基本社会实践活动。新中国成立以来,党和政府对教育与生产劳动相结合极为重视。1958年,中共中央、国务院颁布《关于教育工作指示》开始首次将生产劳动列为正式课程。1978年,邓小平在全国教育工作会议上提出,要更好地贯彻教育与生产劳动相结合的方针,使高校劳动教育得到恢复发展。党的十八大以来,习近平总书记在全国教育大会上提出要培育德智体美劳全面发展的社会主义
学位
阅读作为重要的语言输入途径,是语言学习者获取信息,掌握语言应用技能的基础,也是形成批判性思维、培养英语学科核心素养的重要一环。《新课标》(2017年版)指出,教师应该研究如何在教学中将语言知识转化为学生的语言运用能力,帮助学生正确理解和表达意义、意图、情感和态度,努力实践指向学科核心素养发展的英语学习活动观,实施深度教学,落实培养学生英语学科核心素养的目标。然而目前仍存在教师注重语言知识传授,忽略
学位
阅读是英语教学中的重要环节,对于中小学生来说,阅读不仅培养语言能力,也能促进其身心发展。《义务教育英语课程标准》(2011)版和《中国中小学生英语分级阅读实验稿》都要求在义务教育阶段英语课外阅读量需达到15万词以上,这表明英语阅读教育非常重要。学生应该在老师的指导下补充各种题材的读物以适合不同年龄阶段认知发展的需求,逐步掌握各种阅读策略,养成良好的阅读习惯。在传统教学中学生阅读内容较单一,学生阅读
学位