论文部分内容阅读
随着网络技术的飞速发展以及广泛应用,网络安全成了越来越重要的问题。如何能快速、准确、有效地识别已有的攻击和日益增多的新的攻击就是入侵检测系统所面临的迫切问题。自从Sandeep Kumar博士将模式识别技术引入到网络入侵检测中以来,基于模式识别或智能方法的入侵检测技术得到了迅猛地发展,取得了令人鼓舞的效果。相对于传统的入侵检测技术来说,采用模式识别的入侵检测具有检测准确度高以及能识别大量新型攻击的优点,但是同时也具有计算复杂度高、难以适应实时入侵检测要求的缺点。本文提出了基于BP神经网络分类器的入侵检测模型。由于入侵检测的训练数据具有较高的维数(特征数)和非常大的实例数,因此很有必要对输入到神经网络分类器的训练数据进行特征压缩和实例压缩。这样就可以大大减少采用模式识别方法的入侵检测系统的计算开销。为了达到这一目的,本文对以下几个关键问题进行了研究: 1、训练数据的特征提取与选择。为了降低神经网络分类器的计算量,提高分类器的性能,对输入的训练数据进行特征提取与选择。本文对特征提取与选择算法进行了比较深入地研究。 (1)首先研究了基于主成分分析(PCA)的特征提取方法。在该方法中,先使用ReliefF算法去除原始特征中与分类无关的特征,然后再利用PCA变换提取合适个数的主成分。 (2)接着研究了基于启发式搜索的特征选择方法。提出了一种基于变量相似性的特征选择算法。先使用ReliefF算法去除原始特征中与分类无关的特征,然后利用最大信息压缩准则去除剩下特征之间的冗余性。 (3)然后又把特征选择算法由启发式的搜索方法扩展到非启发式的进化搜索方法。提出了基于改进遗传算法的特征子集选择方法。该方法结合了免疫克隆选择算法和简单遗传算法的优点,性能要优于简单遗传算法。 (4)最后提出了一种基于混合稳态遗传算法的特征选择方法。