基于分类算法的恶意网页检测技术研究

被引量 : 9次 | 上传用户:luoxuefubai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着web2.0时代的来临,B/S架构的web应用以其灵活性、易用性和跨平台性等优点而被越来越多的人们所熟悉,随之而来的恶意网页攻击也逐渐成为网络信息安全的主要威胁之一。有效进行恶意网页检测,尤其是对新出现的恶意网页样本能够及时识别和检测,是当前web安全检测领域研究的重要内容。调研国内外专家学者在恶意网页检测领域的研究动态和主要技术手段,分析现有的基于特征匹配的恶意网页检测技术虽然可以快速准确地检测出已知类型的恶意网页,但存在对混淆变形后的恶意网页无法识别且对于新出现的恶意网页也很难有效分辨的问题。针对这一问题,本文提出了在基于恶意网页特征匹配的基础上使用分类学习算法对未知类型的网页进行分类预测的恶意网页检测方案。本文选择出网页源码中24个能够有效分辨恶意网页的属性特征作为训练分类器的特征向量,分别使用朴素贝叶斯算法、决策树C4.5算法、分类回归树算法和支持向量机四种分类算法在采集的恶意网页样本集上进行分类实验比较,并选择对恶意网页具有高识别准确率的支持向量机算法作为我们恶意网页检测方案的分类算法。由于恶意网页的形式不断增加和更新,标准支持向量机算法很难对新出现的恶意网页样本进行正确识别,所以我们使用具有增量学习能力的自适应支持向量机算法在当前分类器的基础上定期对新采集的恶意网页样本进行特征学习,并更新分类器对新恶意网页样本的识别能力。在上述工作的基础上,本文设计并实现了基于分类算法的恶意网页检测系统(CA-MWDS).系统首先使用知识库中的链接地址黑/白名单和恶意代码特征库,检测出已知类型的网页暗链、恶意链接和恶意代码。然后对于第一步检测中不能判断是否恶意的网页源码,使用基于当前恶意网页样本集训练生成的SVM分类器进行网页类别预测。对新出现的恶意网页样本,系统使用自适应支持向量机算法对当前分类器进行自适应学习,使更新后的分类器能够有效识别新的恶意网页。最后,本文通过实验测试了CA-MWDS系统对恶意网页检测的效率和性能,实验结果表明该系统在恶意网页检测中具有高准确率和低误报率,同时具有自适应学习能力,能准确检测新出现的恶意网页。但是同成熟的商业反病毒软件相比,系统具有较大的时间开销,如何在保证对恶意网页高检出率和准确率的前提下有效降低系统开销是我们后期进行系统优化的重要方面。
其他文献
针对学术研究中一元思维与多元思维的争论与冲突,本文试图把西方解释学理论与中国红学研究的实际状况放在一起来分析讨论,以红学为例,看一下在西方解释学的理论视野下,不同的学者
随着计算机网络技术的发展、个人计算机以及移动终端设备的普及,通过网络学习的方式获取知识信息的人不断增加。数字化学习资源作为网络学习的基础,以其方便快捷、共享性好、
<正>1用法方剂组成:大黄10 g(后下)、生石膏30 g、瓜蒌30 g、杏仁15 g、黄芩15 g、何首乌10 g(后下)、益智仁30 g、蒲公英30 g、当归20 g、桃仁10 g、玄参30 g、生地黄30 g、
随着信息技术的飞速发展,"微时代"来临。由于其自由化程度高、自主性能强,便于选择和传播,且形式上短小精炼、技术上没有难度而被大多数人们掌握。这种文化媒体传播形式和时
目的探索复发难治性成人急性淋巴细胞白血病(ALL)的化疗方案。方法应用长春新碱(VCR)、阿霉素(ADM)及地塞米松(DEX)联合左旋门冬酰胺酶(L-asp)的化疗方案(VAD-ASP),治疗18例
随着我国市场经济建设的逐渐深入,企业面临的市场环境越来越复杂,由此产生的诸多风险因素就成为企业经营中必须关注的内容。企业风险管理是一套由企业董事会与管理层共同建立
1990年代以来,“二流堂”逐渐从一系列怀人忆旧的文章、专题性回忆录和人物传记中浮现出来,但这些回忆性书写大多停留在事实层面的叙述上,较少进行深入的分析性研究。本文努
本文提出了一种利用龙芯LSIB平台实现飞行控制的软件方案。人类对于通信更高速度,更强便捷程度、更快布网速度的追求永不停止。随着近年来人们对突发灾害、军事演习以及大型
国内度假旅游的兴起给旅游业发展明确了新的方向,海南具备度假旅游发展的优越条件,着力开发度假旅游产品,打造国际性度假旅游海岛是海南旅游业发展的应有之义。如何充分利用
在美术领域中出现的“全面反传统”的“新观念”,实质是借外来传统反对自己的民族传统,以西方现代主义艺术取代我国传统艺术。主张发展民族传统艺术的论说,并非固拒西方有益