论文部分内容阅读
摘要 传统Kmeans算法在初始聚类中心选择时具有较大随机性,是影响聚类分析结果的关键因素。利用信息熵辅助选取聚类中心,提出一种信息熵与Kmeans融合算法,并以此为基础构建一种网络入侵检测模型,除完成异常入侵检测外,可使聚类中心随网络变化而动态更新,提高入侵检测效果。通过对比试验,证明了该方法的可行性及有效性。
关键词 信息熵;Kmeans算法;入侵检测
中图分类号 S126;TP393.0 文献标识码 A 文章编号 0517-6611(2014)17-05671-02
Abstract Traditional Kmeans algorithm had randomness in selecting initial cluster center, which was the key factor that influenced the clustering results. Using information entropy to auxiliary select the cluster center, an algorithm combining information entropy with Kmeans was put forward, and a network intrusion detection model based on the algorithm was constructed, this model can detect the abnormal intrusion and make the cluster center change along with the network changes dynamically, which can improve the intrusion detection effect. Experiment results show that this model is feasible and effective.
Key words Information entropy; Kmeans algorithm; Intrusion detection
網络入侵检测是一个从网络中的关键节点收集与网络状况及网络行为相关的数据,对其进行分析以从中发现异常行为特征并提供预警的过程[1-2],以此达到监控网络行为和防御网络入侵的目的。由于入侵行为往往具有较大的不确定性,因此利用聚类分析技术提取数据中隐藏的信息,对识别未知入侵行为具有重要意义。李文华研究了基于模糊C均值FCM聚类的网络入侵检测模型[3];张国锁等针对FCM在处理大数据集时的局限性,提出了改进的FCM聚类算法并将其应用于入侵检测[4];罗敏等研究了基于Kmeans聚类算法的无监督入侵检测模型[5];李贺玲针对数据分布不均匀的问题,提出了改进的Kmeans算法并进行了试验分析[6]。上述方法均针对算法在可处理数据大小上进行研究改进,未涉及算法核心部分。为此,笔者针对Kmeans聚类算法,考虑到数据初始簇中心的选取是影响该算法聚类结果的主要因素,研究利用信息熵辅助确定聚类中心,并建立一种基于信息熵与Kmeans融合算法(IEKmeans)的网络入侵检测模型,结果表明,基于此改进算法的入侵检测模型具有良好的入侵检测率。
4 结论
该研究基于网络入侵数据的特征和现有入侵检测研究存在的问题,提出了一种基于信息熵与Kmeans融合算法的网络入侵检测模型,结果表明,该模型可行,且较传统Kmeans算法而言,提高了入侵检测的检测率,降低了误警率。但该算法及模型的实现,尚未考虑算法的执行效率问题,下一步应研究在尽可能短的时间内完成入侵检测的实现方法。
参考文献
[1] 陈小辉.基于数据挖掘算法的入侵检测方法[J].计算机工程,2010,36(17):72-76.
[2] 李洋.Kmeans聚类算法在入侵检测中的应用[J].计算机工程,2007,33(14):154-156.
[3] 李文华.基于聚类分析的网络入侵检测模型[J].计算机工程,2011,37(17):96-98.
[4] 张国锁,周创明,雷英杰.改进FCM聚类算法及其在入侵检测中的应用[J].计算机应用,2009,29(5):1336-1338.
[5] 罗敏,王丽娜,张焕国.基于无监督类的入侵检测方法[J].电子学报,2003,31(11):1714-1716.
[6] 李贺玲.数据挖掘在网络入侵检测中的应用研究[D].长春:吉林大学,2013:26-30.
[7] 杜强,孙敏.基于改进聚类分析算法的入侵检测系统研究[J].计算机工程与应用,2011,47(11):106-108.
关键词 信息熵;Kmeans算法;入侵检测
中图分类号 S126;TP393.0 文献标识码 A 文章编号 0517-6611(2014)17-05671-02
Abstract Traditional Kmeans algorithm had randomness in selecting initial cluster center, which was the key factor that influenced the clustering results. Using information entropy to auxiliary select the cluster center, an algorithm combining information entropy with Kmeans was put forward, and a network intrusion detection model based on the algorithm was constructed, this model can detect the abnormal intrusion and make the cluster center change along with the network changes dynamically, which can improve the intrusion detection effect. Experiment results show that this model is feasible and effective.
Key words Information entropy; Kmeans algorithm; Intrusion detection
網络入侵检测是一个从网络中的关键节点收集与网络状况及网络行为相关的数据,对其进行分析以从中发现异常行为特征并提供预警的过程[1-2],以此达到监控网络行为和防御网络入侵的目的。由于入侵行为往往具有较大的不确定性,因此利用聚类分析技术提取数据中隐藏的信息,对识别未知入侵行为具有重要意义。李文华研究了基于模糊C均值FCM聚类的网络入侵检测模型[3];张国锁等针对FCM在处理大数据集时的局限性,提出了改进的FCM聚类算法并将其应用于入侵检测[4];罗敏等研究了基于Kmeans聚类算法的无监督入侵检测模型[5];李贺玲针对数据分布不均匀的问题,提出了改进的Kmeans算法并进行了试验分析[6]。上述方法均针对算法在可处理数据大小上进行研究改进,未涉及算法核心部分。为此,笔者针对Kmeans聚类算法,考虑到数据初始簇中心的选取是影响该算法聚类结果的主要因素,研究利用信息熵辅助确定聚类中心,并建立一种基于信息熵与Kmeans融合算法(IEKmeans)的网络入侵检测模型,结果表明,基于此改进算法的入侵检测模型具有良好的入侵检测率。
4 结论
该研究基于网络入侵数据的特征和现有入侵检测研究存在的问题,提出了一种基于信息熵与Kmeans融合算法的网络入侵检测模型,结果表明,该模型可行,且较传统Kmeans算法而言,提高了入侵检测的检测率,降低了误警率。但该算法及模型的实现,尚未考虑算法的执行效率问题,下一步应研究在尽可能短的时间内完成入侵检测的实现方法。
参考文献
[1] 陈小辉.基于数据挖掘算法的入侵检测方法[J].计算机工程,2010,36(17):72-76.
[2] 李洋.Kmeans聚类算法在入侵检测中的应用[J].计算机工程,2007,33(14):154-156.
[3] 李文华.基于聚类分析的网络入侵检测模型[J].计算机工程,2011,37(17):96-98.
[4] 张国锁,周创明,雷英杰.改进FCM聚类算法及其在入侵检测中的应用[J].计算机应用,2009,29(5):1336-1338.
[5] 罗敏,王丽娜,张焕国.基于无监督类的入侵检测方法[J].电子学报,2003,31(11):1714-1716.
[6] 李贺玲.数据挖掘在网络入侵检测中的应用研究[D].长春:吉林大学,2013:26-30.
[7] 杜强,孙敏.基于改进聚类分析算法的入侵检测系统研究[J].计算机工程与应用,2011,47(11):106-108.