离群点挖掘在入侵检测中的研究与应用

来源 :广东工业大学 | 被引量 : 8次 | 上传用户:lbc573332496
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机的普及和网络技术的飞速发展,新类型的入侵行为层出不穷,人们迫切需要能检测出新类型入侵行为的技术。入侵检测中的异常检测技术从理论上能解决这个问题,因此出现了多种异常检测方法。数据挖掘中的大多数算法是针对数据集一般模式的研究,但是现实生活中的各种领域,经常出现一些与数据集的一般行为或模型不一致的数据对象,这些对象称为离群点。对离群点的识别就是对数据集“小模式”的研究。在网络活动中,正常行为远远多于入侵行为,入侵行为本身在本质上有别于正常行为,即入侵行为与正常行为是不一致的。因此,采用离群点挖掘技术来识别入侵行为包括识别出新类型的入侵行为具有一定的理论基础和实践意义。本文主要研究了离群点挖掘方法应用于入侵检测的有关问题,针对国内外有关离群点挖掘方法及其在入侵检测中的应用进行深入研究,结合数据挖掘中的聚类算法进行进一步学习研究,设计了基于离群点挖掘方法的入侵检测模型,同时用聚类算法对数据进行噪声处理,提高算法的运算时间和效率。本文主要工作包括:(1)对入侵检测的相关技术及数据挖掘中的离群挖掘方法进行深入的研究,分析不同入侵检测技术的研究和发展状况;对不同离群挖掘方法分析其优缺点及其他们各自方法应用在入侵检测中的优势,得出有效的结论,把他们应用到入侵检测中。(2)对入侵检测的通用模型进行研究分析,并给出了针对离群挖掘方法的入侵检测模型。(3)由于网络数据集的规模比较庞大,对网络数据集即KDD99数据集进行研究分析,针对本文提出的改进的基于密度的局部离群挖掘对数据集的属性进行特征提取,在数据预处理模块提高了效率,从而有效的提高了离群挖掘的效率。(4)对离群挖掘方法中的基于密度的局部离群挖掘方法进行更加深入的分析和研究;然后对基于密度的局部离群挖掘方法进行改进,结合数据挖掘中的聚类算法提出一种新的离群挖掘方法。(5)对提出的结合聚类算法的基于密度的离群挖掘方法进行试验,把这种离群挖掘方法应用到入侵检测中检测方法的效果。本文把改进的离群挖掘方法应用于入侵检测中,通过试验评估其性能。其实验数据来源于KDD CUP1999数据集。对改进的方法从检测率和误报率两方面进行评估,实验表明该算法针对特征提取的数据集,对新类型的入侵行为具有很好的检测结果。总的来说,本文提出的算法在异常入侵检测中取得了较好的效果。
其他文献
随着混沌理论在保密通信工程等领域的应用,构建实际的混沌系统,产生混沌信号成为混沌应用研究的热点。混沌系统的物理实现是混沌应用的硬件基础。本文以简化Lorenz系统为研究
网络的高速发展,使得分散的、异构的计算机资源有机的结合到一起,并且使其形成一个巨大的网格成为可能。相应地,网格中的任务调度也成为一个非常重要的问题。任务调度算法的
近年来计算机网络技术和多媒体技术等取得了快速进步和广泛应用,网络信息的安全和保护问题成为亟待解决的重要问题。数字隐写作为隐蔽通信的重要手段,近年来成为信息安全领域
无线通信技术的发展彻底改变了我们的日常生活,其技术应用涉及自动化控制、跟踪与监控。随着无线传感器网络(Wireless Sensor Network,WSN)技术的发展改进,出现了体域网(Wire
当前,随着掌上电脑、手机等移动设备的迅速普及,越来越多的应用与服务被包含在移动设备中,如短消息、电子邮件的收发以及一些文件的处理等,使得人们对移动设备上具有快速高效
随着Internet的迅速发展,Web作为全球化的信息源已经成为人们获取信息的重要来源。但是,由于Web页面的无结构性、Web内容的多样性和Web页面的动态变化等原因,人们在Web上很难
随着教育改革的提出和信息技术的发展,信息化教学应运而生。信息技术与课程教学的整合已经成为现代教学的趋势和重要手段。本文针对电路理论学习的重点和难点,建立了基本电路学习支撑平台,为学生提供电路理论的自主学习环境,使学生可以省略方程组的计算,而将学习重点直接放在列写电路方程组上。论文首先基于面向对象语言的继承机制,采用组合设计模式实现电路基本元件和组合元件的虚拟化,实现了元件的统一管理,提高了系统的可
H.264是由ITU-T VCEG和][SO/IEC MPEG联合推出的国际视频编码标准。和其它视频标准相比,它采用了一系列新的关键技术,具有较高的视频编码压缩率和网络适应性,从而在数字视频
本文针对短期气候(月、季、年时间尺度)变化的非线性特征以及影响其变化的机制和因素的复杂性,研究了建立在统计学习理论的VC维和结构风险最小化原则基础上的支持向量机(SVM)
电子技术的迅速发展和互联网的普及使得电子医疗数据急剧增加,医疗信息严重过载而数据质量低,很难从中获取有用的数据;我国医疗资源紧缺,就诊压力大。针对这两方面的问题,提出了面