论文部分内容阅读
入侵检测是继防火墙、VPN、加密等传统安全防护技术之后的新一代信息安全积极主动的防御技术,它提供了对内部攻击、外部攻击和误操作的实时保护,在网络系统受到危害之前拦截和响应入侵。现有入侵检测系统不但误警率高,且实时性差,这是因为入侵检测需要处理大量数据,从中发现入侵行为。而数据挖掘技术的优势在于能迅速从大量数据中发现特征和模式,从而锁定入侵行为。
本文在研究入侵检测系统中的数据挖掘技术基础上,提出了两种约束型Apriori算法,实时更新了入侵检测系统的规则库,提高了整个系统的检测性能,有效降低虚警率和误报率。
本文主要创新点如下:
1、提出了一种带有惩罚项的FCM算法(A Punitive Fuzzy C-means Clustering Algorithm,PFCMC)。解决了经典的C均值聚类算法和模糊C均值聚类算法中对初始聚类中心过分依赖和需要预先知道实际的聚类数目的问题,提高了聚类精度。仿真实验证实了新算法的可行性,以及比经典算法所具有更加广泛的实用性。
2、提出了时态知识型约束Apriori算法(A New Tmporal-knowledge-constraint-based AprioriAlgorithm, NApriori)。利用聚类所得结果,把庞大的数据集分成几组并行处理的小数据模块,对经典Apriori算法进行初步数据分割优化。新算法利用聚类所得聚类中心,又对每个小数据模块进行知识约束和时态约束来产生频繁项集。这算法很好解决了Apriori算法中多次扫描事务数据库产生很大I/O负载和可能产生无用庞大候选集的问题。
3、提出了多规则约束Apriori算法(A Homing-constraint-rule Apriori Algorithm, HCRApriori)。此算法在时态知识约束型基础之上,针对目前许多新型攻击是已存在攻击的衍生物、具有相同的特征子串,且许多强规则事件并不是有趣事件,因而添加递减支持度约束和数据约束。实验证明,新算法可以有效改善入侵检测系统的误警率和虚警率,提高检测效率。