基于FCM算法的P2P流量分类研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:yxyqt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的不断发展,P2P(peer-to-peer,对等网络)应用已经成为最重要的网络应用之一。它为用户提供了丰富的资源和较好的服务质量。然而在带来诸多好处的同时,也同时带来了网络拥塞、病毒干扰和网络安全、版权问题、垃圾信息等诸多问题,因此有效的识别P2P应用已变的至关重要。传统的识别P2P应用的方法有基于端口的识别方法与基于有效载荷特征串的识别方法。然而,随着P2P技术的不断发展,基于动态随机端口的P2P应用和采用加密技术的P2P应用逐渐增多,这些传统的识别方法遇到了发展瓶颈,分类准确率随之下降。在这样一种形势下,基于机器学习算法来处理P2P流量分类问题的方法应运而生,这种方法采用独立于端口、协议和有效载荷的P2P流特征作为算法的输入,通过不断的训练分类器以获得具有较高分类率的分类器。目前基于机器学习算法的研究较多,大致可以分为有监督和无监督学习两类。本文也对这些算法进行了深入的研究,基于前人的研究经验,也掌握了一定的规律。有监督的机器学习算法需要有标识的样本数据,不能识别新的应用类型,而现在新的网络应用层出不穷,所以本文选用无监督算法来进行P2P流量的分类。典型的无监督算法有K-means算法,它是一种硬聚类算法,即具有非此即彼的性质,在一定程度上并不符合客观实际,所以在对机器学习算法充分研究的基础上,本文提出了采用模糊分类的方法来处理P2P流量分类问题,并最终确定采用模糊C均值聚类算法来完成本课题。在研究过程中,同时对FCM算法、数据包的捕获技术、特征提取、以及分类器评测等方面进行了深入的研究,并提出了一种可以有效确定FCM算法中参数m的方法。选择基于matlab的模糊逻辑工具箱来训练分类器,同时为了进行对比实验,基于Weka数据挖掘软件进行了K-means聚类实验。实验结果表明采用FCM算法具有较好的分类效果。
其他文献
体绘制技术是三维数据场可视化技术的一个重要分支,在医学、地质勘探、流体力学等领域均有广泛应用。研究者们提出了多种体绘制算法,其中光线投射算法是现有体绘制算法中图像
微电子技术的进步,推动了低功耗多功能传感器技术的快速发展。无线传感器网络就是由部署在监测区的大量廉价微型传感器节点组成的,通过采取无线通信的模式采用多跳的方式形成
分布式拒绝服务(Distributed Denial of Service,DDoS)攻击已经成为网络服务甚至是网络本身的一个巨大威胁。它利用TCP/IP协议的缺陷和网络带宽资源的有限性,向受害端恶意发
近年来,乳腺癌已成为当今女性发病率最高的疾病之一,严重危害女性健康。医学超声成像因其有效、安全、便携及低成本等特点成为乳腺癌诊断中的一种重要手段。基于乳腺超声图像
随着互联网在全世界范围内的不断发展和普及,越来越多的网络服务要求在互联网上传送三维模型,特别是Web3D技术的出现,使得三维技术在网络上的应用得到普及。然而目前的高精度
作为网络管理的核心功能之一,故障管理可以快速准确地检测、定位故障,减少因网络故障造成的损失,保证网络的可用性和可靠性,并且在一定程度上预防故障的发生。当前的故障管理
信息技术的飞速发展,计算机的广泛应用,使得人们的生活越来越便捷。计算机通过文件、文件夹的方式来存储、管理数据的方式也使得人们对自己资料的保存和更改变得越来越方便。
人机博弈是人工智能的一个重要研究领域,而大型角色在线扮演游戏将是人机博弈新的研究方向,游戏的复杂性,交互性,实时性等都比其他媒介更能模拟出现实复杂世界的不确定性和交
粒子滤波方法是近年提出的一种适用于目标跟踪的有效算法,但存在粒子的退化现象,导致许多状态更新的估计对目标跟踪轨迹不起任何作用,在浪费大量计算资源的同时降低了粒子滤
可视化是表达数据的直观且有效的手段,受到许多领域的重视,如信息学领域、生物学领域、合成生物学领域等。这些领域的迅猛发展为可视化带来机遇与挑战。例如合成生物学是用标