分治加权增量SVM在P2P流量检测中的应用

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:jjJJ012689
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
P2P技术自1999年发布以来,作为一种全新的互联网应用模式开始风靡全球,被财富杂志评为影响互联网的四大科技之一,主导着互联网的发展方向。P2P流量也成为当前网络流量的主要成分。P2P技术的主要应用领域为文件共享、音视频在线、搜索引擎、网络游戏、流媒体、科学计算与协作、即时通讯等。给我们的生活带来巨大便利的同时,也带来了一系列的问题。P2P业务已占据了互联网业务总量的60%-80%,成为杀手级宽带互联网应用。造成了网络带宽的巨大消耗,甚至引起网络拥塞。P2P网络缺少必要的安全机制,给学校网络安全防护打开一扇后门。P2P应用的监管存在技术和管理上的困难,因而在教育网内有些P2P用户就利用此漏洞传播淫秽和反动信息,造成了非常不好的影响。因此,我们必须有效识别及控制P2P流量。SVM具有针对有限样本、泛化性能和推广能力好以及分类精度高的优点,但传统的SVM算法不支持增量学习,随着新增样本的不断加入,致使训练集规模不断扩大,消耗大量计算资源,寻优速度缓慢。在深入研究了支持向量分布的特点的基础上提出了分治加权增量SVM算法。本文主要工作如下:第一,介绍P2P的网络结构和特点及研究现状,介绍了当前P2P流量识别的几种方案,分析了这几种方案在检测过程中的特点及存在的问题。第二,详细讲述SVM的知识,提出了增量SVM的改进算法——分治加权增量SVM。该算法利用广义KKT条件和中心距离比值,舍弃对后续训练影响不大的样本,得到边界支持向量集,对训练样本进行有效的淘汰;将所剩样本合并,进行加权处理,解决某些样本严重偏离所属的类别,对正常分布的样本不公平的问题,分治加权增量SVM算法适合于分类问题。第三,将分治加权增量SVM算法应用到P2P流量检测问题当中。设计并实现了P2P流量检测的模型,通过合理的核函数参数,从检测时间和检测精度两个方面评价了模型的分类效果。实践证明分类器分类效果良好。最后,对论文所做的工作进行了总结,并提出下一步工作研究的重点。
其他文献
本文首先介绍了一些网络安全方面的知识,说明了防火墙的重要性,讨论了防火墙规则优化的一些研究成果。防火墙规则优化问题是当前研究的热点,也有许多优秀的研究成果,本文只针
人脸识别一直是模式识别和人工智能领域的研究热点,而且正在逐渐进入安保防护、网上支付、银行业务和智能家居等人类生活的各个方面。随着稀疏表示理论的不断深入研究和发展,
随着互联网的快速发展,互联网上的数据呈现几何级数态势增长,大量的多媒体数据充斥在网络中,网络上海量数据的增长给传统的存储系统技术带来了严峻的挑战,基于P2P网络的存储
随着工业设计的飞速发展,曲面造型技术现已和人们的生活密不可分。传统的曲面造型技术存在着分裂速度快,曲面的求交与剪裁困难,以及尖锐特征处理等问题,因此,为了构造完美的
近年来,伴随着图像处理技术的迅猛发展,利用图像的不同形态成分(如平滑成分、边缘、纹理等)来进行自适应图像分解已成为很多图像处理任务,如图像压缩、重构、去噪、修补和特
本课题来源于国家“十一五”863计划重点项目“面向流程管理的软件生产线”的子项目“可视化表单工具系统”。   表单的主要任务是数据采集,表单设计工具提供了表单页面的
学位
作为Web 2.0时代的典型代表,微博在近年得到了迅猛的发展和广泛的应用。作为一个基于用户关系的信息分享、传播以及获取的社交网络平台,它不仅可以扩大人际圈实现社会交往,更
数据挖掘是计算机科学、人工智能和数据库研究方向的一项重要课题,它是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、
随着Internet的高速发展,从阿帕网到今天覆盖全球的信息海洋,各种网络服务与信息服务已遍及全世界。因特网已不再局限于门户网站、电子贸易等服务活动,微信、微博、网上银行