基于CNN的JS代码混淆检测方法

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:ltcool
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,互联网给人类带来了极大的便利,但与此同时,恶意网页攻击事件频繁发生,其中大部分的JavaScript攻击代码都是通过混淆实施的。为了进一步对抗恶意网页攻击,保护用户的个人财产安全,检测JavaScript混淆脚本已成为当前的一个重要方向。传统的JavaScript代码混淆检测方法主要采用一些浅层机器学习模型或者度量法,它们都需要事先对JavaScript代码混淆有一定的深入研究,对特征要求严格,特征提取过程复杂,并且特征选择的好坏影响着检测的精确率。据此,论文提出了一种基于Bigram的字符矩阵特征提取方法,以简化特征提取过程。同时提出一种基于CNN(卷积神经网络)的JS(JavaScript)代码混淆检测方法,以提高检测的精确率。首先,针对传统JavaScript代码混淆特征提取方法存在过程复杂,需要对JavaScript代码混淆有长时间的研究以及不具有普适性等问题,论文提出了一种基于Bigram的字符矩阵特征提取方法。该方法受Bigram语义模型与马尔科夫概率矩阵启发,在字符级别上对JavaScript代码进行特征提取,简化了特征提取过程,提高了普适性。其次,针对传统机器学习检测方法大都是一些浅层模型,对特征要求高,且检测精确率低的问题,论文提出了一种基于CNN的JavaScript代码混淆检测方法,利用CNN对矩阵特征向量强大的学习能力,不仅降低了对特征的要求,还有效的提高了检测JavaScript代码混淆的精确率。最后,论文对提出的特征提取方法以及卷积神经网络检测JavaScript代码混淆方法进行了实验。实验表明,论文提出的字符矩阵特征提取方法具有明显的区分能力,并且是传统特征提取方法耗时的一半。同时,相比于传统的机器学习检测方法,卷积神经网络检测方法提升了0.6%精确率。
其他文献
论侵犯著作权犯罪的几个问题刘星明第八届全国人民代表大会第五次会议修订的《中华人民共和国刑法》(以下简称《刑法》),对侵犯著作权的犯罪进一步作出了明确规定,从而填补了我国
[目的]探索便携式X荧光分析仪应用于环境应急监测中的可行性。[方法]采用X荧光分析法选择《土壤环境质量标准》(GB15618—1995)中重点监测的Cd、Hg、As、Pb、Cr进行标准样品
公司简介作为企业形象的窗口,是对外宣传和业务交流的桥梁。随着经济全球化和互联网+时代的来临,电子商务迅猛发展,网上公司简介更成为扩大公司影响力的平台。石化行业作为我
采用组织学方法观察辽宁太子河上游体长5~11cm的北方须鳅Barbatula nuda性腺发育的组织形态结构。结果表明:北方须鳅的精巢属于小叶形,分为6个发育期,精子的发生分为5个时相:
2014年开始,国务院开始正式引导一批非研究型普通本科高校向应用技术型转型。转型的目的是为了深入推进高等教育结构调整,加快应用技术人才培养,提升高校服务社会能力,促进高
新型城镇化发展离不开保障房建设,保障房建设成败的关键在融资。学习、借鉴发达国家和地区保障房建设融资经验对当前中国城镇化建设具有重要指导意义。分析、比较英、美、德、
从20世纪80年代开始,多媒体技术逐渐被运用到中国的课堂中,多媒体技术和英语教学的结合也把中国的英语教学推向了新高潮。虽然中国农村学校使用多媒体辅助教学起步晚于城市学
存在于两栖动物皮肤及其分泌物中的功能性多肽不但结构多样,而且功能各有千秋,发挥着抗菌、抗氧化、抗过敏或促进组织愈合等多种作用。近年来,这些多肽因具有活性强、免疫原
根据英语新课标(2011)的规定,小学阶段英语教学的主要目标是培养孩子学习英语的兴趣和好奇心;同时新课标也提到,师生之间良好的互动对教师教学和学生学习都有积极的影响。互
"学情研判"是把握学生学习起点的重要手段,是落实"学为中心"课堂教学、打造"学本课堂"的有效途径。以"小数加减法"的教学为例,在学情前测、学情分析、学情诊断的基础上,确定