基于互信息的特征选择在入侵检测中的优化研究

来源 :昆明理工大学 | 被引量 : 4次 | 上传用户:auh123123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机和互联网技术的蓬勃发展,威胁和破坏计算机和网络安全的入侵行为层出不穷。入侵检测系统是用于检测计算机和网络中异常活动的工具,是实现更高安全性的有效途径之一。面对目前网络流量激增的情况下,入侵检测系统在处理这些高维的大型数据集时,效率和精度会明显下降。因此,为了解决这个问题,本文将特征选择方法应用于入侵检测中。特征选择是机器学习的重要技术之一,通过特征选择方法对数据进行预处理,筛除海量数据中一些冗余和不相关的噪声数据,将高维空间数据转换成低维空间数据,然后将精简后的数据集用于分类器的训练,最后达到提高分类性能和入侵检测效率的目的。经典的特征选择算法MIFS将互信息(Mutual Information,MI)作为评价特征子集的度量标准,并通过计算特征与目标类之间的互信息的最大值和消除已选特征和候选特征之间的冗余度来选出最优特征子集。由于MIFS算法没有考虑到输入特征的数量对特征之间相关度的影响,于是改进的互信息特征选择算法MMIFS基于MIFS算法进行了优化,MMIFS算法采用了著名的评价特征子集的“最小冗余—最大相关”标准,目的是最大化目标类别和特征之间的互信息量,也能将特征之间冗余度最小化。但这两种算法都需要用一个待定的比例系数对特征之间的冗余度进行校正,而选择一个合适的参数还没有一个准则,如果设置的参数值不恰当将影响特征选择的结果。因此,这两种算法存在一定的局限性。在深入研究了上述两种互信息特征选择算法后,本文提出了一种优化的的互信息特征选择算法OMIFS,并结合LSSVM分类器建立入侵检测系统,然后利用MATLAB平台在NSL-KDD入侵检测数据集中将所提算法OMIFS与改进的基于互信息的特征选择算法MMIFS、基于线性相关的选择算法LCFS进行了对比实验。实验主要对比分析不同特征选择算法对数据进行特征选择以后用于同种分类器LSSVM的分类性能,并把基于OMIFS+LSSVM模型的IDS和不同分类算法应用于IDS的性能进行对比分析。仿真结果表明,在NSL-KDD数据集中,OMIFS算法比其他两种特征算法更有利于提高分类性能,并且通过与基于SVM算法和Clustering算法的IDS对比,基于OMIFS+LSSVM的IDS的入侵检测性能更好。
其他文献
本文对竹材的炭化机理、热处理竹材的苯甲基化改性以及热处理竹材/聚乙烯复合材料的性能三方面进行研究。将毛竹在缺氧环境下180~900℃控制炭化得到不同温度的炭化物,研究了不
目的探讨皮损内注射聚肌胞对寻常疣及跖疣的治疗效果。方法对我科近年来采用皮肤内注射聚肌胞方法治愈的126例寻常疣及跖疣患者的临床资料进行回顾性分析。结果第1疗程结束时
目的分析经皮椎体后凸成形术(PKP)治疗胸腰椎骨质疏松性压缩性骨折(OVCF)的骨水泥的灌注量与椎体内骨水泥的分布情况对早期疗效的影响。方法将该科2011年5月至2013年5月62例O
自2015年开始,保险网络互助平台被越炒越热,作为一种互联网时代下的全新模式,虽然发展势头迅猛,但一直以来也饱受争议。$$只要出几块钱,就能获得一份高达30万的“重疾险”,一种类似
报纸
目的探讨新生儿高胆红素血症的相关影响因素,为临床预防及治疗新生儿高胆红素血症治疗提供理论依据。方法对2011年1月—2012年1月新疆医科大学第一附属医院5 023例新生儿(产
许多中等职业学校校长反映的招生难是否是一个真问题,是否需要以及如何解决。通过分析一系列全国数据,认为出生人口减少并非中等职业学校招生难的主要原因,通过学校合并而导
海洋人类学对渔业社区的生计方式、社会组织结构等问题有着传统的学科关照。然而,在全球化脉络和现代化进程之下,海洋生态、海洋社会以及人海关系被置于巨大的社会变迁中,并
基于干散货二手船交易市场的波动性和交易风险一直备受船舶所有人、投资者、银行和造船厂的关注,通过基于广义误差分布的自回归条件异方差(Generalized AutoRegressive Condi
目的了解新疆额敏县医院及于田县医院医务人员对医院感染知识的掌握情况和院感专职人员对医院感染管理的认知情况。方法自行编制问卷调查表,采用横断面研究方法对额敏县人民
目前,我国企业集团发展领域和工程项目建设领域都正处于重要的转型升级时期,企业集团的兼并重组、股权变化、资产划分对集团管理工作提出了诸多要求,在这种情况下,涉及工程项