论文部分内容阅读
随着网络技术的发展、网络规模的日益扩大,以及承载业务种类的逐渐增多,Internet的发展给人们带来了巨大方便。但是,这些都使网络中出现故障或性能问题的机会增大。准确、快速地检测出网络流量异常,并做出合理的响应,是保证网络正常运行的有效手段,因此网络流量异常检测成为一个备受关注的研究课题。
本文首先概述了网络异常流量及分类,介绍了异常检测的相关技术,对常用的检测方法进行分析和评价,为网络异常流量检测方法的研究提供理论基础;其次,对数据挖掘技术的定义、特点、流程和方法进行了阐述;最后,详细介绍了当前数据采集的各类方法,分析了每一个数据采集方法的优点和不足。其中,重点介绍了基于NetFlow的采集方式的特点,并且把这种方法作为仿真实验的数据采集方式,对基于数据挖掘的网络流量进行异常检测。
目前存在很多网络流量异常检测技术,本文将数据挖掘技术贯穿整个异常流量检测过程。主要分为数据采集、数据预处理和基于数据挖掘的异常流量检测三大部分。第一,利用SNMP和NetFlow进行实验数据的采集;第二,对原始数据进行一系列的预处理,即:填补缺失值、数据规范化、数据约简和面向属性归纳,得到适合异常检测的属性和数据格式;第三:分别将指数平滑技术和k-均值聚类技术应用到网络流量异常检测中,通过仿真实验,取得了较好的效果,成功检测出网络数据中存在的异常;最后以IP地址、端口为分析切入点,并对其上的异常数据检测进行了仿真。