论文部分内容阅读
当今,网络应用得到了极大的普及,随之产生的网络安全问题成为人们关注的焦点。为了解决网络安全产生的问题,研究人员提出了许多方法和技术。其中,入侵检测技术逐渐成为研究热点,取得了许多研究成果。但是,传统的入侵检测技术难以满足当下复杂多变的互联网环境,存在漏报和高误报率等不足,无法满足现实需求。因此,探寻一种高效、准确的入侵检测技术是一个难点和热点问题。本文在对入侵检测原理、基本过程和缺陷研究的基础上,改进经典聚类算法K-means,设计新的检测方法。实验结果表明,改进后的检测算法具有较好的检测效果,有效解决了传统算法的不足。本文的主要研究工作如下:(1)研究聚类分析中的经典算法K-means,分析它的基本原理、聚类过程,总结K-means算法尚存的一些不足之处:抗噪能力弱、初始质心敏感、需要人为指定聚类个数、最优聚类个数难以确定、迭代次数多等。(2)针对以上不足,对K-means算法进行优化,给出改进的算法。在改进算法中,引入Canopy算法,在K-means算法之前先进行一次粗聚类,再依次运用“去噪”、“最大最小原则”、“密度最大原则”、深度理论和K-means计算简化策略,对算法进行优化处理。(3)对改进后的算法进行实验研究。利用改进前后的算法对随机生成的二维数据集进行聚类,分别计算它们的簇内误差平方和。实验结果表明,改进后的K-means算法聚类效果更优。(4)利用KDD CUP99数据集,进行入侵检测仿真实验。实验结果表明,改进的K-means算法在入侵检测中可以提升检测率和降低误报率,显著提升入侵检测的综合性能。