论文部分内容阅读
二十世纪九十年代以来,互联网逐渐深入到人们日常生活的各个方面,成为不可或缺的一部分。互联网流量识别是互联网流量测量领域的研究热点之一,在提供网络信息、保证服务质量等方面,具有十分重要的作用。随着传统的流量(如ftp,tcp,tclnet等)发展到现在的P2P流量,传统的识别方法(如端口匹配方法、净荷特征匹配方法等)变的越来越困难。另外,动态端口和加密流量也对传统的识别方法提出了新的挑战。
与此同时,僵尸网络作为一种日趋严重的因特网安全威胁,如何有效地防止和应对僵尸网络已成为安全领域研究者共同关注的热点和一项迫切的任务。
我们认为TCP流中的命令交互(Command Exchange)包反映了产生流的应用协议的一些本质特征,基于这种想法,提出了一种基于TCP流功能划分的应用协议流量检测新方法。该方法采用机器学习和人工修正相结合的方式挖掘得到TCP流中命令交互包长度序列的时序特征,作为分类时用到的指纹;更进一步,针对P2P应用和僵尸网络的特点,在判定一台主机的类别时汇聚了多个流,甚至多台主机之间指纹匹配的结果。
初步实验表明,该方法对当今流行的四种P2P流量——BitTorrent、eDonkey、PPLive和Maze具有较好的检测效果。此外,我们还尝试将它用于僵尸网络的命令控制信道流量及其邮件滥发流量的检测,初步实验表明它对僵尸网络的命令控制信道流量中交互Ping/Pong包有着较好的检测效果,对僵尸网络的邮件滥发流量也有一定的检测效果。