论文部分内容阅读
随着网络的不断发展,特别是移动互联网和物联网,网络已成为生活不可或缺的一部分。伴随网络发展而来的是,网络安全、服务质量和网络管理等一些列相关问题日益突出。如果不能有效管理网络流量,将对我们日常生产生活将会产生重大影响。网络流量管理的基础就是能有效对网络流进行识别分类,然而基于端口或基于负载的网络流分类方法的有效性已经大大减弱,许多研究者开始将目光转向基于机器学习的方法。因此,针对网络流的模糊性特征,本文研究模糊聚类算法在网络流分类中的应用和效果。本文首先比较了基于端口、基于负载和基于机器学习的网络流识别方法。然后介绍了网络流相关概念和评价标准,并分别指出了这三类方法的优势、不足、使用场景。然后讨论了网络流流统计特征的选择方法,针对网络流分类提出了一种改进的模糊聚类算法,并将其应用到对网络流的识别。最后实现了一个网络流的分类系统。本文主要工作内容如下:(1)在选取网络流特征集时,本文分别从人工经验选择和基于机器学习两个方面考虑结合二者优点寻找合适的网络流特征集,既尽可能多的考虑相关特征以提高分类准确度,同时又保持可接受的计算量。该方法先通过人工经验考察不同特征组对网络流分类的影响,找出关键特征组,然后逐步细化出区分哪些特征对网络流分类具有相对较高的贡献度,最后通过机器学习算法对筛选出的特征进行分类效果比较确定最终合适的网络流特征集。(2)根据网络流特征所具有的模糊特性,本文提出改进的模糊K-Means聚类算法。该算法通过模糊权重来刻画流特征与不同应用协议的隶属关系。针对该算法分类准确率易受初始聚类中心选择的影响,本文基于最小生成树算法对其进行改进。最后将改进的模糊K-Means聚类算法应用于网络流分类中。(3)设计实现了一个网络流分类系统,该系统可完成网络数据包的捕获、过滤、汇聚、特征提取、分类和输出显示等一系列操作。最后通过该系统对实际网络中的捕获的几类数据流进行分类测试,实验结果显示基于改进的模糊K-Means算法相比传统的K-Means算法在对网络流分类的准确率有一定的提高。