论文部分内容阅读
随着网络技术的迅猛发展,人们的生活也发生了极大地改变。与此同时,网络环境的复杂化也使得网络安全管理的难度增加了,网络安全问题成为互联网中人们关注的问题。互联网的应用与发展给人们带来方便,但同时网络的安全问题又给人们增添了困扰。频繁的网络恶意攻击使得原本流畅的网络大面积瘫痪,严重影响了人们访问网络的质量。入侵检测系统(IDS,Intrusion Detection System)的主要功能是保护系统,分析和预测用户的行为。IDS实际上是一个检测非法行为的系统,它可以监控网络上的各种活动。如果检测到攻击,IDS将发出一个警告消息给管理者。面对目前网络系统的威胁,传统的静态防御已经无法满足需求,这时,相对主动的入侵检测技术受到了人们的重视。基于此背景下,本文提出了基于加权关联规则和粗糙集的挖掘算法,并将此算法应用于入侵检测中。本算法主要的步骤如下。首先,由于粗糙集理论是用数学中集合的知识来描述研究对象的,能够提供一种精确有效的数学方法,所以本文使用粗糙集理论对属性进行约简,删除冗余无用的属性。约简后的数据集不但能够准确的表示决策系统,而且能够提高运算速度。然后,在经典关联规则算法的基础上提出加权关联规则方法。由于数据集中每个属性的重要程度在实际中是不一样的,若以相同来对待,可能结果不会那么准确。因此需要区分属性的重要程度,本文用对属性进行加权的方法来衡量属性的重要程度即权值的大小。属性的权值由粗糙集方法来计算,用粗糙集理论中上近似和下近似的方法,来计算当某个属性或属性集被去掉后对整个数据集的影响,值越大则说明属性越重要。由于属性加了权值,所以重新定义了加权支持度和加权置信度的概念。即在原有的支持度和置信度基础上乘以权值。最后,在分类阶段,为了避免规则冲突,即一个数据匹配多个不用类别的规则而被误分,本文使用支持度,置信度和全置信度对规则进行排序。全置信度已被证明是用来区分兴趣程度的很好的标准之一,本文用全置信度更有说服了。新数据根据排序后的规则进行匹配分类,能够改善此问题。文章最后对本方法在入侵检测数据上进行实验验证,全面地分析了实验数据。并与参考文献中其他在此背景下的方法进行比较。实验表明,该方法的准确率优于参考文献中的方法,是高效可行的。