基于决策树的网络流量分类研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:epigeige
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络流量分类技术作为网络管理、流量工程以及安全检测等研究课题的基础,其研究具有重要的实用价值。传统的基于端口和基于深度包检测的网络流量分类方法因为p2p及载荷加密等技术的流行而变得失效。基于“网络流”统计特征和机器学习的方法因为能够有效地解决这些问题而成为了流量分类领域的新方向。目前,大多数基于机器学习的流量分类方法以“流分类准确率”为目标,没有考虑流量分类器在“字节分类准确率”的表现。但随着“大象流”、“老鼠流”之间不平衡现象愈演愈烈,“字节分类准确率”更能体现一个分类器的实际流量分类效果。因此,如何在保证“流分类准确率”的前提下尽量提高流量分类器的“字节分类准确率”成为基于机器学习网络流量分类中一个值得研究的课题。本文首次将C4.5 cs决策树算法应用到网络流量的分类当中,并根据流量分类这一实际背景给出了一种计算C4.5 cs代价矩阵的方法。相比其他方法,采用C4.5 cs算法的流量分类器具有更高的“字节分类准确率”,适合于不平衡流量的分类。由于网络流特征中存在一些无效特征和冗余特征,本文将特征选择算法引入网络流量的分类当中。结合所使用的分类算法,论文提出了一种结合卡方统计量、C4.5 cs算法和遗传搜索策略的特征选择算法。实验结果证明,在引入了本文特征选择算法之后,C4.5 cs算法分类网络流的速度提高了近2倍。最后,在NetMate和Weka的基础上,我们设计并实现了一个基于C4.5 cs算法的网络流量分类原型系统——NTFCS,并对NTFCS的流量采集器、中心分类器以及数据存储器的主要模块和关键实现技术进行了简要的介绍。
其他文献
车标识别是指通过计算机视觉、图像处理与模式识别等方法从车辆图像中提取车标信息,从而获得机动车辆品牌信息的一种实用技术。车标识别技术是智能交通系统中的一个重要研究
由于互联网的飞速发展以及移动终端设备的持续增加,图像的数据量急剧上升。庞大的图像数据必然会对图像处理技术提出更高的要求。如何从庞大的图像库中快速有效地找到想要的
随着计算机技术、网络技术和智能通讯技术的飞速发展,大量的图像数据在网络上广泛传播,并且呈现爆炸式增长,如何有效地管理和利用这些图像资源已经成为当前面临的一项难题。
本文在总结了传统计算机系统的性能测试理论和测试的基础上,设计并实现了Xen的CPU虚拟化系统性能测试的新方法,通过测试Xen系统传输文件时网络I/O、吞吐量、页翻转次数、CPU
在线学习管理系统,是一个利用因特网作为平台传送教学内容,实施网上教学,进行网上交流和学习的信息系统。构建在线学习系统平台,可以克服传统课堂教育的局限性,形成一种主动的、协
现代社会正变得日益复杂,人们所面临的安全形势也越来越严峻。在这种情况下,智能视频监控技术得到了广泛的应用。作为智能视频监控技术中的关键底层技术,运动目标检测算法也
线损“四分”管理模型是当前供电企业比较成熟的一个业务模型,能够准确从电力部门的各个方面反映出线损率这个国家考核电力企业供电质量的综合经济技术指标,具有重要的理论意义
在产品数字化设计与仿真过程中,CAD(Computer Aided Design)活动与FEA(Finite Element Analysis)活动需要紧密关联和互动,因此有效的CAD/FEA集成对于改善产品设计过程,降低设计成本,提高设计质量与效率至关重要。然而,现有基于CAD数据交换的简单CAD/FEA集成方式还远远不能满足实际需要。本文针对产品数字化集成设计与仿真的需要,对CAD/FEA无缝
近年来,随着计算机技术的快速发展,人们对计算机的依赖程度也越来越大,人们对重要数据可靠性的要求越来越高。如果存储在电脑上的重要数据丢失了,所造成的损失往往无法估量,所以对
复杂网络,其实就是复杂系统的一种抽象,复杂系统中的个体可以看成是网络中的节点,而系统中个体之间按照某种规则而自然形成或人为构造的一种关系就是节点之间的边。在现实世界中