论文部分内容阅读
随着互联网络的快速发展,人们在日常的工作生活中对于网络的依赖程度越来越高,各种经济活动也逐渐在网上展开,对于计算机网络安全的要求显著增加。但与此同时,各种网络入侵、攻击等恶意行为层出不穷,严重的威胁了网络的安全。对于专业黑客的攻击和授权用户的恶意行为,现有的防火墙及各种身份验证系统等被动防护系统经常无能为力。因此,迫切需要一种能够采取主动防护的技术来对各种未知的入侵攻击进行检测,入侵检测系统就是在这样的背景下产生的。而将聚类分析应用于入侵检测系统的大规模的数据分析引擎中,也成为研究的热点。本文在研究了国内外基于聚类分析的入侵检测系统的发展现状和分析前人工作的基础上,提出了应用于入侵检测系统中的两种改进的聚类算法。一是对于聚类分析中最为常用的k-means算法的改进。提出一个修改的过滤方法,通过构造一个kd树来加速新聚类中心的生成。对于kd树的节点,算法维持了一个候选聚类中心的集合。同时将簇归类成静态和动态,对于在算法迭代过程中的每个点,使用中心替代的信息来决定候选点的集合。改进后的算法因为将每一步的信息都通过静态和动态两个集合来带入下一步,因此能有效降低原算法的复杂度,提高其在高维数据上的有效性,可以有效应用于入侵检测系统。二是在研究小波聚类算法的基础上,将小波聚类算法与基于熵的特征筛选相结合,利用两者的优点,给出了一种基于熵的特征筛选的小波聚类算法。该算法首先根据原始数据对象间的相似度进行熵度量,根据熵的情况,进行特征筛选,将原始高维数据降维。量化降维后的子特征空间,在量化空间上应用小波聚类,得到检测数据,有效的克服了小波聚类对高维数据效果较差的问题。对比实验表明,本文提出的两种改进算法都在原有算法基础上有效的提高了入侵检测系统的检测率。同时,实验结果也表明,基于小波聚类的方法在入侵检测系统中的应用效果明显好于常用的基于k-means聚类的方法,为今后基于聚类的入侵检测系统的发展提出了一个新的研究方向。