论文部分内容阅读
当前互联网的飞速发展所带来的网络安全问题所波及的范围已逐渐扩大,人们享受着互联网所带来的便利的同时,也不得不关注并想办法解决网络攻击所带来的无法预知的危害。基于包过滤技术的防火墙早已无法应对网络中出现的各式各样的攻击,而入侵检测系统作为保护计算机网络安全的第二道屏障,逐渐引起了科研学者的关注。通过对已有的相关研究成果进行了大量深入研究发现,适用于进行入侵检测的算法的实质是进行对网络入侵攻击进行分类的分类算法,而已有的研究中大都忽略了网络入侵攻击中所存在的攻击种类分布不均衡的现象。因此,本文针对网络攻击各种类数量存在的不均衡问题,做了如下工作:(1)对入侵检测的概念及其分类在查阅了大量文献的基础上进行一个概括性的介绍。再对网络中的四大类攻击进行简单分析,进而引出不均衡数据集的概念,并且从各类样本所含数据量、每维数据所代表含义等方面深入分析本文所选用的实验数据集NSL-KDD数据集。(2)对机器学习和深度学习进行了深入学习,并将本文所用到的部分进行了简单的介绍,为后面的研究做铺垫。(3)针对网络攻击各种类数量存在的不均衡问题,提出了一种果蝇优化加权极限学习机的入侵检测算法。利用加权极限学习机作为前馈型神经网络具有训练时间短、泛化性能好等优点,对于NSL-KDD入侵检测数据集中的不均衡现象,增加少数类攻击的权重,使得对网络攻击中的少数类攻击的检测率相较于传统的机器学习有了大幅度的提高。再利用果蝇优化算法强大的全局寻优能力,对加权极限学习机中的隐含层输入权值和偏置进行全局寻优,以避免陷入局部最优解,实现对NSL-KDD入侵检测数据集的分类。(4)深度学习早已成为如今科研的热点,本文利用深度学习算法中的深度置信网络的强大的特征学习能力,对入侵检测数据集NSL-KDD中的每一条数据进行特征学习后,再输入第三点所提到的分类算法中进行分类。结合深度学习算法有效的特征提取和有针对性的分类算法的优势来进一步提高分类效果。(5)在前置条件相同的条件下,设计对比实验。通过将大量的实验结果进行对比,得出研究结论。利用入侵检测数据集NSL-KDD中的数据进行对比实验的结果表明,经过改进的果蝇算法优化后的加权极限学习机对数据集中少数类攻击的检测率和整体的分类准确率均有一定程度的提高,误报率也有所降低。在此基础上,将NSL-KDD数据集经过深度置信网路进行特征学习后再进行分类所得到的结果又有了进一步的提升,对四大类别攻击的检测率均提升了20%左右,误报率也降到了0.32%,但是随着算法的复杂度增加,检测时间也有稍许增加。