子空间聚类算法在流量分类中的应用

来源 :浙江大学 | 被引量 : 0次 | 上传用户:yhh9
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在线识别网络流量的业务类型是互联网流量控制,网络资源管理等工作的基础。目前互联网中各种业务流量随着用户需求的快速增长而不断发生变化,包括业务特征值集合的变化,新的业务类型的出现等,而现有的流量分类器却无法及时,准确地识别出流量的新业务特征值集合和业务类型,从而使流量分类器呈现可靠性差,扩展性不足等缺陷。当前的流量分类器难以为网络资源的有效管理提供依据。  本文的研究工作是设计一种离线数据分类方案来增强流量分类器来提高业务特征库更新效率,从而提升分类器对网络环境变化的适应能力。文章首先对现有的在线流量分类方法进行了研究和分析,总结了当前流量分类器在识别流量业务类型时存在的不足;接着,提出了通过采用机器学习方法来提升DPI特征库的更新效率的方案,在方案中,我们设计了一种子空间聚类方法—FPCLIQUE算法。FPCLIQUE算法将用于对流量数据进行分类,目的是降低离线分类流量数据的人工参与程度,提升流量分类器识别新业务流量的效率。由于这项工作需要大量的样本测试数据,因此我们从校园网中心进行了包流量数据的采集,完成了业务流的重组工作,并从中提取了样本数据的基本特征。最后,我们通过大量的数据测试,验证了FPCLIQUE算法得到的业务特征值集合在离线流量类别划分上的精确性,低误判率特性,良好的召回率,精细的业务分类等特性,这些特性能够有效地提高DPI特征库的更新效率,以及帮助我们实现进一步构建网络自适应能力强的DPI流量分类器。
其他文献
随着汽车电子软件功能设计越来越复杂,使用传统的软件开发方法已经无法满足市场的需求,与此同时软件产品移植到其他硬件平台的成本日益加大。为了解决汽车电子软件的可扩展、可
快速发展的云计算技术使得SOA架构成为了业内的主流架构体系。而在计算机行业的发展历程中,早期开发的很多Web系统直到现在都还在持续维护运作中。但是,由于这些系统使用陈旧的
在逆向工程,形变检测等领域,点云对齐被广泛的应用。随着三维扫描仪和三维打印机的发展和逐渐普及,工业界对点云对齐技术越来越重视,并且提出更高的需求。点云对齐是两片任意位置
随着大数据时代的到来,传统的关系型数据库逐渐不能满足海量非结构化数据管理的性能和价格要求。海量数据中蕴藏着巨大的商业和研究价值,但目前缺乏一套完整的面向海量非结构化
天线方位角下倾角的精确规划是影响无线网络覆盖最重要的因素之一。传统的计算方向角和下倾角的方法基于物理测量方式,存在这测量复杂,测量不方便,测量受限制于测量环境等缺点。
随着数字媒体技术的飞速发展和电子数码设备的普及,图像的产生变得越来越容易,图像数量也日益增多。在大规模图像数据中,如何快速准确地找到需要的图像是值得深入研究的问题。因
现场可编程门阵列(FieldProgrammableGateArrays,FPGA)以其可编程、高并行性、高集成度等优点,被广泛应用于通信、控制等领域。然而,随着FPGA器件日益复杂、系统规模日益庞大,作
在大数据时代,如何从海量的数据中挖掘到自己感兴趣的内容成为至关重要的问题。为了满足用户的个性化需求,需要进行个性化推荐。传统的个性化推荐是根据用户对物品的历史评分、
随着计算机技术和硬件的飞速发展,虚拟现实技术在服装领域的应用也越来越多,这种技术对降低企业的生产成本、加速产品开发等方面都有很大的改善。目前对虚拟服装的研究主要集中