论文部分内容阅读
近年来,VoIP和P2P IPTV应用已经成为互联网上流行的流媒体应用。由于这些应用的协议私密性、连接端口号的随机性以及网络环境的复杂性等原因,使得对它们流量的识别和测量分析面临较多困难。本文针对VoIP和P2P IPTV流量提出了有效的识别算法并进行了深入的测量研究。针对QQ语音应用,提出了一种基于贝叶斯和卡方统计的流量识别算法(B&C)。分析QQ语音应用的源端模型,使用贝叶斯算法识别QQ语音应用的语音流量。分析QQ语音应用的非语音流量,定义心跳数据包,使用卡方统计算法识别心跳包。实验结果表明,B&C算法可以有效地识别QQ语音流量:识别漏判率低于2%,误判率低于0.1%。将研究对象从单一的QQ语音流量扩大到全部的VoIP流量,提出了一种基于主机行为和流行为分析的流量识别算法(HBFBA)。首先进行主机行为分析,利用通信主机所占用的端口号的差值,将VoIP应用的流量与传统应用的流量分离开。然后进一步进行流行为分析,计算流中数据包大小的熵值分析数据包大小的无序程度;计算自适应的估计值分析连续相邻数据包间隔的相关性。实验结果显示HBFBA算法能以很低的漏判率和误判率准确识别多种VoIP应用的流量。即使新型的VoIP应用出现,HBFBA算法仍可以有效地识别其流量。针对P2P IPTV应用,提出了一种基于改进熵和径向基函数神经网络的流量识别算法(IE-NNRBF)。以改进熵为基础,自动地提取数据包大小特征和应用层头部格式特征作为流量的动态签名。采用径向基函数神经网络,实现对流量的非线性分类。实验结果显示,IE-NNRBF算法的识别正确率达到98%以上。以PPLive视频点播应用为例,通过主动测量的方式研究了P2P IPTV点播覆盖网络。设计了主动测量覆盖网络的软件系统VoDCrawler,提出的新模型有效地解决了测量过程的收敛条件问题。通过对大量测量结果的分析,从拓扑结构和网络抖动两方面对覆盖网络进行了研究,揭示了被测量网络具有小世界图的特性,网络中的对等体具有不耐心的特性,以及对等体的当前运行时间是剩余运行时间的一个很好暗示。对这些性质和相关参数进行优化和控制,可以更好地进行网络管理。