论文部分内容阅读
随着入侵攻击的进步,传统的浅层感知机模型已经无法检测日益复杂的入侵行为。本文将深度学习应用到入侵检测领域中,深度网络由多层形式化的神经网络构成,先通过无监督学习逐层初始化网络的权重,然后再通过有监督对整个网络模型进行微调。深度学习不仅能够抽取更优异的特征,还能学到更复杂的目标函数,所以该方法能够更好的处理样本量巨大且高维的入侵数据集。虽然深度学习方法检测入侵行为优势明显,但是深度网络训练速度慢,鲁棒性差,并且容易过拟合。本文提出了堆叠式降噪自编码器深度网络的入侵检测方法,可以防止过拟合和消除噪音,本文的主要工作有以下四个方面:(1)本文采用NSL-KDD数据集,但是该数据集中有部分定性特征,针对这些特征采用了高维特征映射方法对数据进行预处理,增强了数据的辨识度。(2)由于传统的非线性激活函数不仅梯度下降速度慢,而且容易出现梯度消失,本文在深度网络的隐藏层采用了Relu激活函数,实验表明,该方法与采用simgoid激活函数的深度网络比较,深度网络的收敛速度明显加快。(3)由于原始数据中可能不完整或被破坏,本文在自编码器学习过程中加入了高斯白噪声,对原始数据进行降噪,增强了深度网络的鲁棒性。实验表明,自编码器中加入了高斯白噪声之后,准确率可以提高0.5%。(4)由于入侵检测数据集中各类别数量不匀称,所以在训练的过程中容易出现过拟合,本文采用过了Dropout正则化,Dropout是通过近似组合模型的方式来防止过拟合。实验表明,Dropout方法比权重衰减方法泛化效果更好。通过实验得出堆叠式降噪自编码器深度网络的最优参数,与入侵检测领域的其他方法对比,本文提出的模型具有较高的准确率。堆叠式降噪自编码器深度网络的入侵检测方法有四个优点:适用于高维的特征数据;提高深度网络的泛化能力;加快网络的训练速度;提高网络的分类准确率,有效地减少误报和漏报。