论文部分内容阅读
Internet骨干网流量中混合了来自于固定宽带接入和3G/4G蜂窝网络接入的不同客户端流量,在不依赖于应用层信息和查看数据报内容的前提下,使用传统的流量特征和分析方法难以将两者正确区分开。针对流量依据网络接入类型进行分类的需求,本文提出了一种蜂窝网络上移动宽带数据流量特征分析方法,据此构建分类模型,可有效区分3G/4G和固定宽带接入环境中产生的数据流量。论文主要对蜂窝网络链路层通信技术对IP数据报时延的影响进行分析,结合TCP/IP协议和时延的被动测量方法,构建了 6个时延相关的网络流量特征,用于区分通过3G/4G和固定宽带接入的流量来源。在此基础上,采用有监督机器学习方法,建立了网络流量的分类模型,利用公开的数据流量进行交叉验证。实验结果表明,利用这些时延特征建立的流量描述模型,能够有效区分来自于蜂窝网络接入或固定宽带接入的数据流量,正确率达到92%以上,并具有良好的覆盖性与容错性。本论文的主要研究工作有如下几点:(1)从网络架构对时延影响的层面,分析了蜂窝网络、WLAN和固定宽带的链路异同,研究其对网络数据流量中时延特征的影响,据此构建了蜂窝网络的流量特征。(2)针对蜂窝网络和WLAN、固定宽带网络流量的差异特征,提出了相应的特征统计量化方法及准则,对应总结了在混合流量中进行特征提取的流程和步骤。(3)采用有监督学习算法,构建流量分类模型,使用公开数据集进行分析实验,验证了提取特征对流量分类的有效性,并对不同特征分类贡献度及不同条件下模型的优缺点进行分析。