P2P流的测量与识别方法研究

被引量 : 0次 | 上传用户：lv53647678

【摘要】

：

P2P(Peer to Peer)是一种新的网络应用模式,其最大特点是P2P网络依靠网络边缘节点,而非中心节点实现自组织和资源共享。近些年来,P2P技术被广泛应用于文件共享、语音服务、流

【作者】

：

柳斌

【发表日期】

：

2008年期

【关键词】

：

对等网 Bittorrent协议行为特征支持向量机特征选择半监督聚类机器学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

P2P(Peer to Peer)是一种新的网络应用模式,其最大特点是P2P网络依靠网络边缘节点,而非中心节点实现自组织和资源共享。近些年来,P2P技术被广泛应用于文件共享、语音服务、流媒体、即时通信等领域。P2P技术在快速发展的同时也给网络管理带来了许多新的问题。如P2P应用消耗了大量带宽,版权纠纷以及安全问题等。P2P采用了动态端口,报文加密等逃避网络监测的技术,这使得传统的端口识别法对P2P流的识别不再有效。因此,研究有效的P2P流识别方法成为P2P流管理的重要课题。从典型的P2P系统测量,启发式识别方法,未知P2P流发现以及机器学习等四个方面对P2P流的测量和识别方法进行了研究。BitTorrent是目前广泛使用的混合式P2P系统的典型代表。从BitTorrent协议的主动测量,被动测量以及BitTorrent流的模型化三个方面展开了研究。首先提出了一种BitTorrent系统的主动测量方法,通过在BitTorrent节点中插入消息测量和状态测量模块,采集BitTorrent节点在下载过程中收发的各种消息以及状态变化信息,从协议内部对BitTorrent节点的下载过程进行观察。测量结果表明:BitTorrent节点下载时从群中少数节点获得大量数据,同时也主要向群中极少数节点上传数据,且下载量最多的节点通常也是上载量最多的节点。在被动测量研究中,提出了一种基于应用层特征的BitTorrent流实时测量方法。采用了流匹配测量框架,以流为基本单位进行匹配,设计了一种基于异或运算的哈希算法用于流匹配。利用应用层特征对BitTorrent报文进行识别,准确度较高。建立了测量算法的误报和漏报模型,并分析了特征报文与流长度的关系,提出应重点关注长流的应用层特征。分别提出了BitTorrent流流长和流时间间隔的分布模型。研究表明:BitTorrent流时间间隔可以用Weibull分布描述。BitTorrent流流长可以用Lognormal分布描述。对启发式P2P流识别方法进行了研究。提出了一种基于多行为特征的P2P主机识别算法。首先在分析P2P节点连接形式,远端地址分布以及端口行为特点的基础上,提取了双向连接率,IP地址随机测度和高端口连接率三种特征,然后通过阈值分类实现P2P流识别。实验表明该算法误报率低。与此同时,提出了一种基于支持向量机的P2P流应用级分类方法,利用支持向量机优良的分类性能,对不同应用类型的P2P流进行了分类。通过对BitTorrent,Emule,PPLive,PPstream 4种P2P流的分类实验,验证了方法的有效性,平均分类准确率为92.2%。对未知P2P应用的发现进行了研究。首先提出了一种基于多维聚类树的流分析方法(Multi-dimensional Clustering Tree,MCT)。该方法首先对流数据的每一维进行单维聚类,发现单维显著类。然后,构建多维聚类树发现多维显著类。MCT算法能自动挖掘网络中的显著流,描述显著流的多维属性,同时可以反映流量显著的IP子网。在MCT算法的基础上,提出了一种未知P2P流的识别方法。首先,利用P2P流的远端地址分布、双向性和高端口特征,定义了P2P流疑似度指标sp2p,对MCT算法挖掘出来的多维显著流进行P2P流疑似度判别。对高疑似度的P2P流,通过应用层特征匹配方法,去掉已知的P2P流,实现未知P2P流的识别。实验结果表明:MCT算法可以清楚了解网络流量的构成情况,利用sp2p能够有效识别出网络中流量较大的多种P2P应用。将机器学习方法应用到应用流的识别问题中,提出了一种基于熵函数的串联式特征选择算法。首先利用特征的后验概率分布来衡量特征对分类的有效性,接着采用顺序后退搜索方法,以分类器本身的分类准确率作为评估标准去除冗余特征。采用上述特征选择方法从Andew Moore数据集的249种特征中筛选出了11种分类特征。同时,提出了一种基于半监督聚类的应用流分类方法。首先采用粒子群优化的K均值聚类方法对混合数据进行聚类,然后利用少量标记数据确定簇与应用类型的映射关系,从而实现应用流分类。通过对Andew Moore数据集的实验表明:基于半监督聚类的应用流分类方法有较高的流识别准确率。

其他文献

长江上游流域土地利用对面源污染影响及其差异

基于遥感与地理信息系统技术,对比分析了长江上游流域2000—2006年土地利用变化;利用输出系数模型,计算了土地利用引起的面源污染负荷,并从面源污染TN和TP负荷量、负荷强度和

期刊

遥感地理信息系统长江上游流域面源污染输出系数模型土地利用

稳定表达Aβ42的神经母细胞瘤Aβ42/Neuro-2a细胞系的建立

阿尔茨海默病是一种以进行性认知功能障碍及人格改变为主要临床表现的神经系统变性疾病。Aβ的神经毒作用长期以来被公认为是导致阿尔茨海默病发病的重要因素。传统的研究多

学位

Aβ42重组质粒阿尔茨海默病tau

论赵树理小说创作的民间立场

民间立场是相对于政治意识形态和主流文化形态对人生、生活乃至世界所进行的民间性关照。赵树理的民间立场,是站在现实生活中农民的利益立场上来应对时代的变化,并且体现了在

学位

赵树理民间立场叙事话语

合家福连锁超市信息化建设与应用研究

我国的信息化建设正在深入社会各个方面,企业的信息化是信息化建设的重要组成部分。虽然企业信息化建设失败率高,然而成功的信息化能够带来巨大竞争优势,吸引着众多企业开展

学位

信息化管理信息系统业务流程重组绩效评估

我国中小学班级规模研究

目前,我国实现了普及九年制义务教育,在适龄儿童就学问题基本得到解决的基础上,基础教育的重心已从保证学生数量转向提高基础教育质量。班级规模是影响教育质量的重要因素之

学位

班级规模大班额教育均衡

染色质构象捕获及其衍生技术

染色质的构象在基因表达调节方面起重要作用.介绍了染色质构象捕获、环状染色质构象捕获、3C碳拷贝、ChIP-loop、ChIA-PET和Hi-C等技术的基本原理及发展历程,对影响实验结果

期刊

染色质空间构象染色质构象捕获基因表达调控染色质相互作用

卵巢癌细胞系RMG-Ⅰ Lewis(y)抗原含量变化对其卡铂耐药性的影响

利用Lewis(y)抗原稳定高表达细胞株RMG-Ⅰ-H,研究细胞表面Lewis(y)抗原含量变化与细胞对卡铂耐药性的关系.利用四甲基偶氮唑盐(MTT)法测定不同浓度卡铂作用后细胞系RMG-Ⅰ-H

期刊

卵巢癌Lewis(y)抗原卡铂耐药性

介入术后无复流现象的研究进展

<正>无复流现象是经皮冠状动脉腔内介入术(PCI)术后的常见并发症,其定义为PCI治疗后,已解除心外膜冠状动脉机械性梗阻,但血流仍持续减低或相应区域心肌仍然灌注不足,表现为造

期刊

经皮冠状动脉腔内介入术无复流冠状动脉疾病

家庭精神环境对5-6岁儿童社会性发展的影响因素研究

社会性是个体由于参与社会生活、与人交往,在固有的生物特性基础上形成的那些独特的心理特征,是作为社会成员的个体,为适应社会生活所表现出的心理和行为特征。幼儿社会性是

学位

儿童社会性发展儿童的年龄儿童的性别家庭精神环境

沈阳城市灰尘中金属的空间分布特征研究

近十年来,有关城市灰尘重金属污染的研究逐渐成为一个热点。城市灰尘包括街道灰尘、区域灰尘、大气降尘[1]。本文的研究对象为街道灰尘和大气降尘。街道灰尘和降尘都是物质组

学位

街道灰尘大气降尘空间分布特征金属沈阳市

P2P流的测量与识别方法研究

与本文相关的学术论文