入侵检测系统中不平衡分类算法的研究

来源 :兰州大学 | 被引量 : 5次 | 上传用户:majian_hunu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术与互联网技术的快速发展,给人们的生活带来诸多便利,同时也带来了很多信息安全方面的问题。信息安全问题会影响个人或企业对网络的安全需求,甚至会给国家带来不同程度的威胁及损失。为了保证网络信息的安全,需要提出有效的安全防御措施。目前,基于数据挖掘技术的入侵检测已经成为一种重要的防御技术,受到学者们的广泛关注。在对入侵检测方法的研究过程中,随着数据规模不断扩大、复杂性不断增加,出现了数据类别分布不平衡的问题,如何有效地处理入侵检测系统中出现的不平衡数据成为一项新的挑战。本文对不平衡数据分类问题进行深入研究,主要针对不平衡数据集中的少数类样本的检测问题,本文提出了两个新的入侵检测模型,分别为基于抽样算法及模糊支持向量机的入侵检测模型(FSVMs)与基于集成特征选择算法及多分类器的入侵检测模型(F_SDK)。为了有效解决入侵检测系统中不平衡数据分类问题,提高检测模型对少数类样本的分类性能,本文通过对多种数据处理方法的研究,结合了抽样算法、半监督方法和模糊支持向量机的思想,构建了一个新的入侵检测模型(FSVMs模型)。该模型首先利用合成少数类过采样技术对数据集进行处理,使得数据集变得相对平衡,使模型能有效学习到少数类样本的信息,然后将抽样处理后的数据样本输入到基于模糊原理的半监督支持向量机分类器中进行训练学习。为了验证FSVMs模型的检测性能,本文在由KDDCup99和NSL-KDD数据集生成的十个多分类不平衡数据子集上进行了实验,采用召回率、准确率、精确度、误报率、F分数和G平均六个性能指标作为模型评价标准。实验结果表明,FSVMs模型可以提高入侵检测系统的检测性能,尤其是对分布稀疏的U2R和R2L两种攻击类型的检测性能有明显地提升。本文通过对多种特征选择算法、集成方法和分类器理论的学习和研究,构建了另一个新的入侵检测模型(F_SDK模型)。该模型首先利用集成的特征选择算法进行数据集的重要特征提取,集成了基于相关性和基于互信息的两个特征选择方法的特征评估结果,选择出最有价值的特征组合;然后采用多分类算法对特征提取处理后的数据进行模型训练,该模型训练多个不同的分类器,每个样本得到多个不同的预测标签,最后使用多数投票原则确定测试样本最终的分类标签。为了验证F_SDK模型的检测性能,本文在NSL-KDD数据集上进行了实验,并使用准确率、精确度、召回率、F分数和G平均五个性能指标作为模型评价标准。实验结果表明,F_SDK模型可以很好地解决不平衡数据分类问题,提高了入侵检测系统对分布稀疏的U2R和R2L两种攻击的检测性能。
其他文献
<正> 随着我国经济的高速发展,大中城市的交通及环保问题日益突出。要解决这一矛盾,就不得不采取以节能环保为前提的立体式城市交通模式,而地铁正是这种立体式城市交通的一个
分别从以下五个方面阐述了绿色设计是工业设计未来之路。绿色设计是工业设计理念自我完善的必然选择 ;是保证人类自身生存 ,实现可持续发展的必然选择 ;是 2 1世纪绿色消费浪
音乐教育是学生美学教育的重要组成,对培养学生审美情操,锤炼学生良好品性作用明显。我国地域辽阔,广大农村地区因为师资条件、硬件设备不足等于原因长期处于缺乏音乐教育或
行走辅助训练机器人是一种能够帮助具有运动功能障碍患者和老年人进行辅助行走的康复训练设备,在控制下肢髋关节、膝关节运动符合正常步态的同时,控制骨盆的运动规律,并与下肢步
经济责任审计是随着我国经济体制和政治体制改革的不断深入发展.以及依法治国方略的确定而产生的.是我国社会主义审计事业的一个创举。在没有现成的经验可供借鉴的情况下.未来的
十八大报告是全党智慧的结晶,认真学习宣传贯彻十八大精神是我们当前和今后一个时期的首要政治任务。十八大报告指出,必须更加自觉地把全面协调可持续作为深入贯彻落实科学发
干电极脑电采集技术是目前国内外脑电信号处理技术研究的热点。干电极脑电采集技术具有使用简单、不易受环境约束的优点,因此有着广阔的应用前景。首先分析引入干电极脑电采
门诊经常见一些爸爸妈妈抱着哮喘发作的宝宝,焦急不安,不停地问医生:"我们家宝宝都按时吃药了,为啥还经常发作啊?"。其实,宝宝有哮喘除了按一定要求规范用药外,日常生活中尽量避
介绍金属罐头的封口方法及原理,并对此过程中的常见故障与排除进行分析。
由于社会发展和科技的不断进步,高层建筑结构的发展速度日益迅猛。随着建筑物使用年限的推延,其健康状态越来越受到人们的关注,结构的变形监测也逐渐受到工程技术界的重视。而现