因特网行为特性与流量分类研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:zhenghs2ooo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
因特网是一个庞大的、持续变化的对象,其异质性、复杂性和动态性为因特网的研究带来了许多挑战。尤其在近十年,因特网的发展经历了一个快速成长的阶段。在这个阶段,用户数取得了爆炸式增长,高容量骨干及宽带接入技术逐步成熟并被大规模部署,新应用的层出不穷和已有应用的持续演变等,这一切都使得因特网流量更加复杂。深入了解因特网流量特性,积极探索因特网行为变化对于因特网流量建模、网络运行维护管理、网络安全及流量工程等均具有重要意义。另外,在因特网发展的新形势下,基于端口(port)和载荷(payload)的传统流量分类方法的局限性已凸现,迫切需要一种新型的、有效的流量分类方法,为因特网业务的QoS保证、网络异常检测等提供支撑。本文就是在这一背景和挑战下开展因特网流量行为分析及应用流量分类的研究工作。本文在研究中主要使用的是近四年来(2005-2008)在校园网上收集的流量数据,认为由于校园网规模较大,用户群体又多为学生,网络应用具有多样性,其网络流量较为典型,能够在一定程度上反映因特网流量的复杂性和动态性。 本文首先描述了在cernet(中国教育科研网)的一条接入链路上设立监测点(monitoredpoint)并进行双向的“被动测量”,从网络负载和TCP连接的性能两个角度宏观调查了当前因特网流量模式及特性,其中不仅有单天的日流量模式及特性,还有长达18个月(2006.10-2008.03)的长期流量模式及特性的变化趋势,列举并讨论所观测到的一些主要现象及可能的产生原因。 接着,又从“流”(flow)的角度微观剖析了分属于这四年不同时段的流量数据,分别从流的统计特性和主机行为两个方面对“单向流”和“双向流”深入讨论,展示了它们之间的差异性以及在这四年间的变化。还提出了“流量剖面”(trafficprofile)的概念,并分别创建了“单向流”和“双向流”主机的流量剖面。这不仅为本文的研究提供帮助,也为以后有关主机行为的研究提供了有力工具。 最后,本文提出一种新的、将多分类模型下的集成学习与协同训练相结合的流量分类方法,它使用基于流的统计特性作为特征。与过往在许多研究中被广泛使用的单分类器方法相比较,这种方法主要克服了三个局限性:性能瓶颈、弱适应性以及标记样本需求量过大。实验结果表明:采用本方法后分类的错误率较传统机器学习方法有明显下降;在不同网络环境下适应性显著提高;能识别更多原先未知的流量,并且具有区分未知应用类型的能力。
其他文献
随着数据信息资源几何级数地增长,存储技术应用面临着严峻的挑战。各种海量信息存储系统相继出现,其中基于对象的存储系统,是一种具有跨平台数据共享、高性能、安全性及可扩
随着计算机及通信技术的迅猛发展,全球信息化步伐日益加快,现代计算机网络已成为信息社会的基础设施,渗透到社会的各个方面,网络在人们的日常工作中发挥着越来越重要的作用。大部
操作系统调试和系统安全已经成为倍受人们关注的两大重要问题。然而,传统的软件调试方法难以对系统的状态进行完整回放,更不能对操作系统进行调试;另一方面,大多数的入侵检测
无线传感器网络是由大量传感器节点通过无线网络连接形成的自组织网络。网络中的传感器节点具有计算、存储、感知和无线互联能力,能够实时地监测、感知和采集位于节点部署区
Skyline查询主要用在多目标决策、数据挖掘、数据库可视化等方面,其优势引起了越来越多研究者的关注;然而在目前存储系统的元数据检索中,主要是采用遍历检索和纯哈希的检索的
随着图形学的迅速发展,以及玩家对游戏画面的要求成倍的增长,室内场景的研究渐渐下降到次要的位置,越来越多的研究聚焦到室外场景上面。然而与室内场景相比,室外场景的复杂度
数据挖掘就是从海量的数据中挖掘出可能有潜在价值的信息的技术。这些信息是可能有潜在价值的,支持决策,可以为企业带来利益,或者为科学研究寻找突破口。关联规则挖掘是数据挖掘
随着计算机网络技术和互联网产业的不断发展,越来越多的信息数字化并进入计算机网络,使得社会对安全高效的信息存储技术有着迫切的需求。除了扩充容量和提高速度,信息存储还
自动程序设计是使用自动化手段进行程序设计的技术和过程,后发展成为使用自动化手段进行软件系统生成的方法,被称为软件自动化。其目的在于提高软件生产率和软件产品质量。软
随着网络带宽的不断增加和网络犯罪手段的多样化,已有网络取证系统由于数据捕获和分析能力的不足会导致信息的丢失,削弱了证据的说服力和法律效力。因此开展网络取证技术的相