论文部分内容阅读
Skype作为一款基于P2P的VoIP通信软件,以其低廉的通信费用和优质的语音通话服务取得了广阔的市场。然而它的出现给网络带来了沉重负担、冲击了传统VoIP业务。为此,研究Skype通信机制、准确识别Skype语音流有着重大意义,一方面可以借鉴其关键技术改进目前的网络电话语音质量,另一方面可以对Skype流量进行合理限制,从而保证其他实时网络应用的带宽使用。由于Skype采用了私有通信协议和AES加密算法,这给我们的识别工作带来了严重阻碍。本文通过理论分析和应用解析,提出了一套能有效识别Skype语音流的方法,首先通过对Skype网络流量特征分析,发现其登陆过程可以作为识别关键突破口,并对其进行了着重分析,在此基础上提出了信令包检测以识别Skype主机,再通过基于卡方统计的负载特征识别出Skype流量,最后根据语音流的固有频率特征识别出其中的语音流,即为Skype语音流。本文主要工作如下:1.Skype网络流量特征分析。Skype从03年诞生至今版本不断更新,早期对Skype的分析成果大部分已不再适用,为此本文在前人的基础上重新审视Skype,分析了其关键构成、程序流程,并通过禁止特定端口、阻断与特定节点连接对其登陆过程进行了着重分析,其结果有助于识别Skype主机。2.采用基于心跳探测的Skype主机识别方法。Skype客户端通过与一个超级节点建立连接来登陆Skype网络,登陆成功后Skype客户端向该超级节点有规律地发送一种心跳包来探测与该超级节点连接的有效性。本文利用该特征识别运行Skype客户端的主机。3.采用卡方分离器对Skype流量进行提取。在识别出Skype主机的基础上,从其产生的所有流量中通过卡方分离器获得Skype的流量。此方法是借用了07年Dario Bonfiglio等人在Sigcomm上发表的运用卡方分离器识别Skype流的思想,Skype流量包含Skype的语音、视频、即时消息、文件传输等流量。4.采用基于频域特征的Skype语音流识别方法。根据对Skype语音数据包的包大小和包到达时间间隔的分析,发现其包到达时间间隔组成的时间序列具有一定周期性,即频域上表现为其能量在以某个频率为中心的范围内比较集中,我们通过这个集中的能量所占的百分比对其进行表征;另一方面,Skype语音流的包大小具有很小的波动性,这可以通过对包大小时间序列求取方差来提取。结合以上两个频率特征可准确的从上述第3点中获取的Skype流量中提取Skype语音流。本文将信令包检测、卡方统计和频域分析思想运用到Skype的语音流的识别中,取得了较为理想的结果。