基于RELIEFF-FCBF组合的入侵特征选择算法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:xtchen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息时代,每天大量新的网络数据涌入互联网,网络空间异常行为更加复杂多变,数据的高维属性,导致入侵检测面临检测效率、准确率低。为了建设安全可持续的网络环境,为互联网的快速发展提供保障,入侵检测系统引入新技术实现创新刻不容缓。常用特征选择方法引入入侵检测系统中,实现对网络数据的初步选择,达到对多维数据降维的作用,去除无关、弱相关、冗余的特征,提高分类的效率、准确率,减少误报率,提升了入侵检测系统的性能,实现系统智能化和满足现代网络空间安全检测要求。  本文参考了国内外特征选择算法在入侵检测应用的研究,研究了典型的四个特征选择算法,通过优势互补组合提出了两个新的,针对入侵检测系统的KDD CUP1999数据集降维方法。在本篇论文中做了以下主要工作:  (1)四个算法对比分析:ReliefF算法不能区分已选特征集中特征间的相关紧密性;FCBF算法能高效处理特征之间的冗余性;Re-ReliefF算法在效率、准确率、误报率方面还不够好;最大相关最小冗余算法(mRMR)中特征间相关性表述的互信息度量准则,能更好地区分特征间的相关关系。  (2)改进的两个组合算法:ReliefF算法和FCBF算法结合,提出了一种两阶段Re-FCBF算法,分别对原始特征集进行相应的筛选,获得区分数据高效的特征组成的最佳特征子集;Re-ReliefF+算法在Re-ReliefF算法的基础上加入了最大相关最小冗余算法(mRMR)的思想,把作为特征间相关性表述的互信息度量准则引入其中,从而更好地区分特征间的相关关系,进一步去除冗余特征。  (3)改进的组合算法实验对比分析:KDD CUP1999作为入侵检测数据,采用支持向量机来训练数据和测试数据,获得相应的最佳特征子集在数据分类的准确率、误报率、漏报率、训练时间、预测时间。实验表明:Re-FCBF算法和Re-ReliefF+是一种有效的过滤式特征选择算法,它能够有效地去除无关、弱相关、冗余特征,提高入侵检测的效率、准确率,减少误报率。
其他文献
在以往的维吾尔文全文检索系统中,由于维吾尔文本身构词方式及形态的灵活多样性,不可避免地需要进行词干切分,并以词干作为索引项建立索引,然而切分工具本身的不足和局限性,
管道机器人是在特殊环境下为人类提供服务的一种智能化设备,随着管道检测技术的发展和应用,在役管道的维护需求为管道机器人的研究和应用提供了广阔的发展空间,这领域的研究
阴影是增强计算机虚拟现实的一种重要技术,阴影特效是3D游戏,军事仿真领域不可或缺的一部分。在3D场景中添加阴影,可以使场景更加逼真生动。高质量的阴影效果,不仅可以让虚拟
网格为科学研究和工程应用中的大规模问题求解提供了一种理想的计算平台。网格资源的异构、分布、动态及自治特点,使得资源管理问题充满挑战。网格资源管理方法和技术研究成
问答系统是信息检索系统的一种高级形式。它与传统搜索引擎不同,它允许用户用自然语言进行提问,并给用户返回确切的答案,而不是返回一系列相关链接。随着自然语言处理的研究,
随着网络技术和信息家电的飞速发展,互联网用户和智能家电数目地不断增长促进了家庭网络的数目迅速增加,将传统家居中原本独立的设备与功能相整合,构建一个功能强大、操作个
网格技术为基于动态、异构和跨域的协同资源共享与问题求解提供了新的解决方法,通过网格对大量廉价的计算资源、存储资源等进行整合,在提高计算效率的同时,大大降低了处理成
模糊测试是一种自动或半自动的发现软件故障的方法,具有可用性好、自动化程度高、误报率低、对目标程序源码没有依赖的优点。模糊测试如今已经成为漏洞挖掘的一门相当有效的技
计算机支持的协作学习CSCL (Computer-Supported Collaborative Learning)是指利用计算机技术(尤其是多媒体和网络技术)来辅助和支持协作学习的一种学习方法。当前CSCL已经成
软件测试对软件质量的保证具有非常重要的意义,随着面向对象分析与设计在软件开发中的大规模应用,面向对象软件测试也成为不可忽视的研究领域。传统的测试技术已经不能保证面