论文部分内容阅读
采用适当的特征选择算法缩减网络流量数据集的特征规模,对于提高基于机器学习的网络入侵检测系统的性能有着重要的意义.设计了一个以入侵检测性能保证为目标的特征选择算法评估方案,并从选择效果和时间消耗两个方面对比分析了多种常用特征选择算法在不同数据集上的应用效果.实验结果表明,KDD CUP99和NSL-KDD等数据集的冗余特征项接近于50%;基于L1和L2正则项的最小二乘回归特征选择算法(LS_L1)的鲁棒性最强;在特征选择算法中结合特征项之间的关联关系挖掘算法会更有利于提高网络入侵检测系统的性能.这些实验结果