论文部分内容阅读
随着P2P、VOIP等新颖应用技术的不断涌现和网络应用类型复杂度的日益增长,网络流量的本质正在不可避免的被革新。通过有效的技术手段,管理和控制网络中的各种业务流量,为不同应用分配合理的带宽资源,提供不同级别的服务质量保障,是当前网络运营中面临的主要挑战之一。本文介绍了流量分类的研究背景和发展现状。对于采用固定端口号进行通信的应用,流量分类方法非常简单,无法应对采用动态端口技术的数据流。基于内容的流量分类方法,是指把数据包的内容与已知流量类型中的流量特征进行比对,如果与某种特征匹配就认为该数据包是属于这种应用类型。新型P2P采用加密、动态端口等方式躲避检查,所以基于传输层统计特征的方法应运而生。该方法不需要解析数据包的负载内容,保护了用户的隐私;也不会利用端口去分析流量类型,有效识别使用动态端口技术而躲避监测的数据流。本文提出用ECOC (Error Correcting Output Codes)集成神经网络的方法( ECOC-NNE )进行流量分类。纠错输出编码是一种把多类分类问题分解成若干个二类分类问题来求解的方法。它通过编码的形式纠正由单分类器引起的偏差以提高在多类问题中有监督算法的分类精度。ECOC很好的纠正了单个传统神经网络的分类误差,显著提高集成神经网络一次识别多个互联网流量类型的分类精度。当前流行的主要是离线网络流量分类,而设计在线实时网络流量分类器显然是很有必要的。基于互联网应用行为的实时性、易变性、易逝性和不可逆等特性,有效地在线智能识别方法成为当前该领域关注的热点。本文提出一种分层实时网络流量分类算法,该算法是针对流量分类问题专门设计的,不适用于其他分类问题,采用查找表和分阶段相结合的方法。分层实时流量分类模型在实时性跟分类精度上是几种常用算法性价比最高的算法。基于FPGA网络流量分类系统包括两个部分:FPGA端和PC端。FPGA端实现数据包接收,提取数据包五元组并确定该数据包是否为一个新的数据流,提取并更新每个数据流的特征,将特征发送到PC。PC端接收来自FPGA提取好的数据流特征送入到分层实时流量分类模型分类,实时监控网络中各种数据流类型的分布和构成。本文较系统从算法设计、软硬件实现完成关于网络流量分类的研究。