论文部分内容阅读
P2P技术快速发展的同时,也导致了网络阻塞、网络安全性和网络资源产权保护等问题的产生,因此,通过研究有效的P2P流量识别方法,用以解决上述问题成为重要课题。 论文通过对比机器学习的几种常用分类方法和不同的P2P分类策略;重点研究了基于网络流特征的P2P流量分类方法,并对影响分类的关键网络流特征进行了深入分析;通过引入基于支持向量机技术,给出了P2P网络流量多分类模型,借助LIBSVM工具对分类模型进行了仿真,论文主要工作如下: (1)研究了关于有监督、半监督和无监督机器学习原理及其代表性算法,对比分析目前存在的基于端口、会话、深层数据包检测和流量行为的P2P流量分类策略。引入了基于P2P网络流量特征分类的思想,给出了基于网络流特征的检测流程,突出了网络流定义及生成流程,涉及在线数据包捕获,并对影响分类的关键特征进行了说明和举例分析。 (2)结合支持向量机学习方法阐明其原理,着重讨论了SVM核函数和SVM算法及其选择问题,给出了基于SVM的分类流程和多分类处理模型即DAGSVM模型,相应给出了模型使用的算法,重点强调了通过网格搜索法和k-折交叉验证法获取算法所使用的惩罚因子及核函数因子参数值。 (3)使用LIBSVM工具仿真,为了实验准确性,实验数据选用奥克兰大学提供的AucklandSet;充分利用支持向量机在处理小样本、非线性、高维数样本的优良特性,通过对基于传统SVM分类算法等构建的分类模型进行分类预测,对比分类结果,分析评价了其性能优劣,表明本文给出的方法更具优势。