论文部分内容阅读
P2P(Peer-To-Peer)对等网络技术虽然推动了互联网的蓬勃发展,但P2P流量对传统的因特网构架如骨干网的中心路由器等造成了很大的影响。据统计数据显示:过去几年P2P应用对网络带宽的占用比在骨干网大致为40%-70%,在城域网或局域网中甚至可能超过了80%,消耗了大量的网络带宽。P2P流量识别的意义在于可以让网络服务提供商更好的管理网络,降低网络运维成本,提高网络服务质量提供数据支持和监控方向。
P2P流量识别的本质是评估某网络拓扑中所有节点在某时间段的P2P流量比例,在基于信任抽样的P2P流量识别系统中,采用信任抽样的意义在于在一定的误差允许前提下通过对节点的设置信任值以降低抽样成本,进而减少抽样系统识别的时间和空间复杂度,使得识别系统的结果计算接近实时。本文围绕这一基于信任抽样的P2P流量识别这一主题展开了深入的研究,主要工作如下:
(1)基于一阶信任抽样的P2P流量识别方法的研究。首先介绍了该方法的系统体系架构,并通过结合直线等距抽样方法和对数信任模型,提出了一阶对数信任抽样策略。然后研究了深度报文识别中的多模式匹配算法,按照提出了的模块架构和信任抽样策略编码实现了一个简单的基于一阶对数信任抽样的P2P流量识别软件,用该软件在实际网络环境中监测网络流量、采集数据。最后对该系统识别结果和相关数据进行了分析和总结。
(2)基于大数据处理平台下的深度报文计算和识别的研究。首先将分布式并行计算平台用于运行P2P流量识别的主要计算任务(即深度报文检测算法),采用了云管端式的平台架构,逐个分析了该平台架构中各个模块的内部构成和功能。然后提出了一个运行在该大数据处理平台之上的并行识别和计算的然后算法,并简要描述了该算法。最后介绍了数据报文消息封装、并行结果处理及周期划分等方法。
(3)基于二阶信任抽样的P2P流量识别方法的研究。首先介绍了该方法的系统体系架构,并将二阶抽样的相关理论和方法结合贝叶斯信任度计算法提出了基于二阶贝叶斯信任抽样策略。然后介绍提出了蓄水池二阶抽样算法,并分析了该算法的可行性及证明了该算法的正确性。最后通过仿真验证了该策略,并对仿真结果进行了分析和总结。
P2P流量识别的本质是评估某网络拓扑中所有节点在某时间段的P2P流量比例,在基于信任抽样的P2P流量识别系统中,采用信任抽样的意义在于在一定的误差允许前提下通过对节点的设置信任值以降低抽样成本,进而减少抽样系统识别的时间和空间复杂度,使得识别系统的结果计算接近实时。本文围绕这一基于信任抽样的P2P流量识别这一主题展开了深入的研究,主要工作如下:
(1)基于一阶信任抽样的P2P流量识别方法的研究。首先介绍了该方法的系统体系架构,并通过结合直线等距抽样方法和对数信任模型,提出了一阶对数信任抽样策略。然后研究了深度报文识别中的多模式匹配算法,按照提出了的模块架构和信任抽样策略编码实现了一个简单的基于一阶对数信任抽样的P2P流量识别软件,用该软件在实际网络环境中监测网络流量、采集数据。最后对该系统识别结果和相关数据进行了分析和总结。
(2)基于大数据处理平台下的深度报文计算和识别的研究。首先将分布式并行计算平台用于运行P2P流量识别的主要计算任务(即深度报文检测算法),采用了云管端式的平台架构,逐个分析了该平台架构中各个模块的内部构成和功能。然后提出了一个运行在该大数据处理平台之上的并行识别和计算的然后算法,并简要描述了该算法。最后介绍了数据报文消息封装、并行结果处理及周期划分等方法。
(3)基于二阶信任抽样的P2P流量识别方法的研究。首先介绍了该方法的系统体系架构,并将二阶抽样的相关理论和方法结合贝叶斯信任度计算法提出了基于二阶贝叶斯信任抽样策略。然后介绍提出了蓄水池二阶抽样算法,并分析了该算法的可行性及证明了该算法的正确性。最后通过仿真验证了该策略,并对仿真结果进行了分析和总结。