论文部分内容阅读
P2P技术自1999年发布以来,作为一种全新的互联网应用模式开始风靡全球,被财富杂志评为影响互联网的四大科技之一,主导着互联网的发展方向。P2P流量也成为当前网络流量的主要成分。P2P技术的主要应用领域为文件共享、音视频在线、搜索引擎、网络游戏、流媒体、科学计算与协作、即时通讯等。给我们的生活带来巨大便利的同时,也带来了一系列的问题。P2P业务已占据了互联网业务总量的60%-80%,成为杀手级宽带互联网应用。造成了网络带宽的巨大消耗,甚至引起网络拥塞。P2P网络缺少必要的安全机制,给学校网络安全防护打开一扇后门。P2P应用的监管存在技术和管理上的困难,因而在教育网内有些P2P用户就利用此漏洞传播淫秽和反动信息,造成了非常不好的影响。因此,我们必须有效识别及控制P2P流量。SVM具有针对有限样本、泛化性能和推广能力好以及分类精度高的优点,但传统的SVM算法不支持增量学习,随着新增样本的不断加入,致使训练集规模不断扩大,消耗大量计算资源,寻优速度缓慢。在深入研究了支持向量分布的特点的基础上提出了分治加权增量SVM算法。本文主要工作如下:第一,介绍P2P的网络结构和特点及研究现状,介绍了当前P2P流量识别的几种方案,分析了这几种方案在检测过程中的特点及存在的问题。第二,详细讲述SVM的知识,提出了增量SVM的改进算法——分治加权增量SVM。该算法利用广义KKT条件和中心距离比值,舍弃对后续训练影响不大的样本,得到边界支持向量集,对训练样本进行有效的淘汰;将所剩样本合并,进行加权处理,解决某些样本严重偏离所属的类别,对正常分布的样本不公平的问题,分治加权增量SVM算法适合于分类问题。第三,将分治加权增量SVM算法应用到P2P流量检测问题当中。设计并实现了P2P流量检测的模型,通过合理的核函数参数,从检测时间和检测精度两个方面评价了模型的分类效果。实践证明分类器分类效果良好。最后,对论文所做的工作进行了总结,并提出下一步工作研究的重点。