P2P流的多维挖掘与识别方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:ergezhi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以流媒体分发为主的应用网络的突现导致网络流量指数级增长,如P2P流,而且伴随着DDOS(Distributed Denial of Service)攻击、蠕虫攻击等流量也夹杂其中,对网络的稳定和正常运行构成严重威胁。因此,对网络流量的构成进行深入分析,及时把握网络流量的性质、比例和变化,并采取相应的措施成为了当前网络管理的首要任务。把网络流的srcIP、dstIP、Protocol、srcPort和dstPort进行五元组等级聚类的方法称为网络流的多维聚类。在对原始的多维聚类算法和多维聚类等级树的结构进行分析的基础上,对原始的多维聚类算法进行改进。采用先按照Protocol、srcPort和dstPort进行三元组聚类,在挖掘出显著的三元组规则后,再把srcIP和dstIP的单维聚类结果与之结合,得出显著的五元组规则的方法来完成多维聚类。其中,采用两种新方法来处理多维聚类树特有的菱形结构,避免重复派生和重复匹配操作,分别是:先采用自顶向下后采用自底向上的方法构造多维聚类树和直接限定重复节点只在某一分支派生。既减少了每次匹配多维规则时的NetFlow表长度,又减少了需要用NetFlow表来匹配的多维规则数目,从而提高了原始的多维聚类算法的效率。在网络流的多维聚类结果中,根据每条多维规则的srcIP和dstIP分布情况,定义IP熵,利用IP熵来描述srcIP和dstIP的分布离散程度。结合IP熵、IP前缀和P2P流的双向性定义了识别P2P流的指标sp2p。根据计算出来的每条多维规则的srcIP和dstIP的sp2p值大小,判断这条多维规则是否为P2P流。最后利用广域网和局域网的NetFlow数据对系统进行了性能和功能测试。实验结果表明:改进后的多维聚类算法有效地降低了原始的多维聚类算法的时间复杂度;同时通过多维流挖掘,可以清楚了解当前网络流量的构成情况;而且,系统能够识别出占网络总流量比例较大的多种P2P流,如BitTorrent、PPLive等。
其他文献
随着嵌入式技术和网络技术的不断发展,将嵌入式监测设备接入Internet网络进行远程监测正逐步取代传统的监测方案。本文设计了嵌入式远程状态监测系统的总体结构,完成了其核心
随着军事采购信息化的发展,需要处理的信息资源随之飞速增长,军事采购的过程越来越复杂,如何使用计算机对采购过程进行自动和有效的组织和管理,成为当前军事采购信息化建设迫
随着Internet的发展,网络信息安全逐渐成为Internet及各项网络服务和应用进一步发展的关键问题。传统的方法是对操作系统进行安全加固,通过各种各样的安全补丁提高系统本身的
随着互联网的普及和开源框架技术的不断发展,许多早期开发的金融系统已经无法满足金融企业发展的需求,逐渐成为了企业内部的遗留系统。它们一方面保存了企业内部十分重要的商业逻辑和大量珍贵的数据;另一方面也因为技术人才的缺失和开发效率的低下逐渐成为企业发展的瓶颈。因此如何应用更成熟、先进的技术和框架对这些遗留系统进行应用与开发成了目前很多企业关注的焦点。本文所涉及的多货币基金会计系统就是这样一套开发于上世界
程序切片是一种重要的程序分析技术,用于从原有程序中抽取对特定程序点上特定变量有影响的成份以构成新程序,通过分析这种新程序(称为程序切片)达到简化原程序分析的目的。二十
基于移动对象位置的服务(Location Based Service,LBS)是智能交通系统(Intelligence Transportation System,ITS)中的重要组成部分。其中,最优路径选择、实时路况查询、周边目标
随着计算机技术的快速发展,互联网已经成为人们快速获取信息的重要手段之一。尤其是移动互联网的普及,使人们可以随时随地在互联网上分享各式各样的信息,这使得网络上的数据
网络拓扑发现技术已经广泛地应用在各种项目软件中。然而,随着网络结构复杂度升级,这给拓扑发现带来了挑战。所以我们越来越需要一种高效,准确的网络拓扑算法自动发现网络拓扑结
近年来动画制作、视频游戏、计算机辅助几何设计等应用领域飞速发展,对数字几何图形网格模型的编辑方法提出了更高要求。人们希望用简单、直接的人机界面交互方式,快速获得符合
建立领域业务模型的主要目的是满足单位或组织根据业务需求的变化,不断进行流程的分析、优化、重组和再造的需要,并为业务应用需求的描述、信息资源的规划与共享提供基本依据与