基于模糊K-Means的网络流分类系统研究与实现

来源 :广东工业大学 | 被引量 : 2次 | 上传用户:smiletonyfrank
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的不断发展,特别是移动互联网和物联网,网络已成为生活不可或缺的一部分。伴随网络发展而来的是,网络安全、服务质量和网络管理等一些列相关问题日益突出。如果不能有效管理网络流量,将对我们日常生产生活将会产生重大影响。网络流量管理的基础就是能有效对网络流进行识别分类,然而基于端口或基于负载的网络流分类方法的有效性已经大大减弱,许多研究者开始将目光转向基于机器学习的方法。因此,针对网络流的模糊性特征,本文研究模糊聚类算法在网络流分类中的应用和效果。本文首先比较了基于端口、基于负载和基于机器学习的网络流识别方法。然后介绍了网络流相关概念和评价标准,并分别指出了这三类方法的优势、不足、使用场景。然后讨论了网络流流统计特征的选择方法,针对网络流分类提出了一种改进的模糊聚类算法,并将其应用到对网络流的识别。最后实现了一个网络流的分类系统。本文主要工作内容如下:(1)在选取网络流特征集时,本文分别从人工经验选择和基于机器学习两个方面考虑结合二者优点寻找合适的网络流特征集,既尽可能多的考虑相关特征以提高分类准确度,同时又保持可接受的计算量。该方法先通过人工经验考察不同特征组对网络流分类的影响,找出关键特征组,然后逐步细化出区分哪些特征对网络流分类具有相对较高的贡献度,最后通过机器学习算法对筛选出的特征进行分类效果比较确定最终合适的网络流特征集。(2)根据网络流特征所具有的模糊特性,本文提出改进的模糊K-Means聚类算法。该算法通过模糊权重来刻画流特征与不同应用协议的隶属关系。针对该算法分类准确率易受初始聚类中心选择的影响,本文基于最小生成树算法对其进行改进。最后将改进的模糊K-Means聚类算法应用于网络流分类中。(3)设计实现了一个网络流分类系统,该系统可完成网络数据包的捕获、过滤、汇聚、特征提取、分类和输出显示等一系列操作。最后通过该系统对实际网络中的捕获的几类数据流进行分类测试,实验结果显示基于改进的模糊K-Means算法相比传统的K-Means算法在对网络流分类的准确率有一定的提高。
其他文献
网络抖动(Churn)是指在对等网络中,由参与者的匿名、自由性以及规模大的特点导致的大量节点频繁自发地加入、离开或失效的现象。抖动是影响对等网络系统性能的一个重要因素,
随着Web服务技术的快速发展和应用,Web服务的数量与日俱增,提供的功能也越来越多样化。然而,单个Web服务提供的功能有限,很多时候都不能满足用户多样性的需求,这就需要将已有
随着信息技术的不断发展,社会信息化程度的不断提高,企业的信息化程度越来越高,由于业务流程变化、需求变化或是业务整合的需要,企业各信息系统需要更多的通信和交互,各系统
最优化是当前计算科学和工程实际领域中普遍存在的重要问题,例如经济学中的利益最大化、电子工程中的信号干扰最小化等。优化问题的种类及数量很多,本文针对单目标优化、多目标
随着计算机和网络技术的发展和普及,计算机化考试的应用越来越广泛。这种考试形式可以相对减少考试环节中的人为主观因素,可以更快捷、更方便、更准确地组织考试工作,并大大
随着互联网技术和计算机技术的发展,P2P技术和网格计算已经发展为一个重要的研究领域,两者都是为了能够很好解决大规模的地理分布的资源共享而兴起的下一代计算技术。其中两者
一个无线传感器网络是由部署在一个地理区域的传感器节点组成的,用来监视物理现象如温度、湿度、地震现象等等。典型的,一个传感器设备由三个基本部分组成:在周围环境获得数据
在现代企业中,由于磁盘损坏导致的数据丢失或者访问中断等,都可能给企业带来无法挽回的损失,数据的容灾备份在信息化时代变得日益重要。容灾备份系统在一定程度上较好保证了
数据挖掘(Data Mining)是近几年来发展起来的一门新兴的数据库技术,它是按照既定的业务目标,对大量的数据进行探索和分析,从中提取潜在的、隐含的、有价值的知识,并进一步将其模
全局优化问题几乎应用于每一个学科,工程领域和业务中。例如,工程师要为设计的汽车提供最佳的性能。为了实现这一目标,需要优化汽车的配置参数。最佳参数配置的查找就属于全