论文部分内容阅读
随着互联网技术迅速发展,网络安全问题的关注度持续上升,入侵检测技术成为一个研究热点。本文主要对聚类算法中的高斯混合模型和K-means进行研究,针对算法的不足提出改进,以使其应用于网络入侵检测中,通过实验仿真验证算法的有效性。本文的主要研究内容和贡献如下:(1)针对高斯混合模型对初始值敏感的缺陷,本文提出了一种基于改进密度峰值的高斯混合模型聚类算法(DP-GMMC)。该算法首先依据相似度矩阵计算局部密度和距离,对密度公式采用?律15折线方法进行改进,根据决策图确定聚类个数以及聚类中心;其次采用高斯混合模型计算样本点的对数似然函数;最后运用最大期望算法迭代更新均值、方差、混合系数,并根据概率完成样本点的划分。仿真实验表明,在Iris数据集下,与GMM算法、DP算法、AHC-EM算法相比,DP-GMMC算法在聚类准确度上可分别提高33.6、17.34、1.53个百分点,且能得到准确的聚类数。(2)针对K-means算法随机选取聚类中心的缺陷,本文提出了一种基于改进花朵授粉的K-means算法(IFPK-means)。该算法首先使用混沌策略增加种群多样性;其次运用花朵授粉算法反复迭代以得到最优值;然后采用禁忌搜索算法寻优;最后利用K-means算法完成聚类。仿真结果表明,与ABC算法、PSO算法、DE算法、FPA算法、DEFPA算法相比,IFPK-means算法在平均聚类准确度上可分别提高13.26、5.41、6.59、12.70、4.33个百分点。(3)为了验证改进聚类算法在入侵检测中的性能,本文首先针对入侵检测数据集进行数值化、标准化、降维等处理;然后运用DP-GMMC算法和IFPK-means算法在该数据集上进行对比实验。仿真结果表明,NSL-KDD数据集下,与GMM算法、DP算法相比,DP-GMMC算法的检测率分别提高8.14、3.94个百分点;与K-means算法、DEK-means算法相比,IFPK-means算法的检测率分别提高7.31、4.71个百分点。该论文有图38幅,表20个,参考文献62篇。