论文部分内容阅读
随着计算机的普及和网络技术的飞速发展,新类型的入侵行为层出不穷,人们迫切需要能检测出新类型入侵行为的技术。入侵检测中的异常检测技术从理论上能解决这个问题,因此出现了多种异常检测方法。数据挖掘中的大多数算法是针对数据集一般模式的研究,但是现实生活中的各种领域,经常出现一些与数据集的一般行为或模型不一致的数据对象,这些对象称为离群点。对离群点的识别就是对数据集“小模式”的研究。在网络活动中,正常行为远远多于入侵行为,入侵行为本身在本质上有别于正常行为,即入侵行为与正常行为是不一致的。因此,采用离群点挖掘技术来识别入侵行为包括识别出新类型的入侵行为具有一定的理论基础和实践意义。本文主要研究了离群点挖掘方法应用于入侵检测的有关问题,针对国内外有关离群点挖掘方法及其在入侵检测中的应用进行深入研究,结合数据挖掘中的聚类算法进行进一步学习研究,设计了基于离群点挖掘方法的入侵检测模型,同时用聚类算法对数据进行噪声处理,提高算法的运算时间和效率。本文主要工作包括:(1)对入侵检测的相关技术及数据挖掘中的离群挖掘方法进行深入的研究,分析不同入侵检测技术的研究和发展状况;对不同离群挖掘方法分析其优缺点及其他们各自方法应用在入侵检测中的优势,得出有效的结论,把他们应用到入侵检测中。(2)对入侵检测的通用模型进行研究分析,并给出了针对离群挖掘方法的入侵检测模型。(3)由于网络数据集的规模比较庞大,对网络数据集即KDD99数据集进行研究分析,针对本文提出的改进的基于密度的局部离群挖掘对数据集的属性进行特征提取,在数据预处理模块提高了效率,从而有效的提高了离群挖掘的效率。(4)对离群挖掘方法中的基于密度的局部离群挖掘方法进行更加深入的分析和研究;然后对基于密度的局部离群挖掘方法进行改进,结合数据挖掘中的聚类算法提出一种新的离群挖掘方法。(5)对提出的结合聚类算法的基于密度的离群挖掘方法进行试验,把这种离群挖掘方法应用到入侵检测中检测方法的效果。本文把改进的离群挖掘方法应用于入侵检测中,通过试验评估其性能。其实验数据来源于KDD CUP1999数据集。对改进的方法从检测率和误报率两方面进行评估,实验表明该算法针对特征提取的数据集,对新类型的入侵行为具有很好的检测结果。总的来说,本文提出的算法在异常入侵检测中取得了较好的效果。