论文部分内容阅读
流量的源识别是一种通过对匿名网络的通信流量的行为属性进行分析来识别通信双方身份的技术。对于Web应用来说,流量的源识别一方面可以应用于追踪发现使用IP欺骗技术发起分布式拒绝服务(DDoS)的攻击者;另一方面可应用于Web站点流量的指纹识别(WebsiteFingerprinting):对于Web浏览,通过流量分析(TrafficAnalysis)技术来识别客户端用户所访问的Web站点,尽管用户使用了隐私加强技术(如加密和代理服务器)来隐藏Web站点流量中所包含的通信内容和Web站点的真实网络地址。 本文在对现有的Web站点流量的指纹识别技术和对应的防御技术分别做了充分的归纳分类的基础上,针对现有Web站点流量识别技术研究工作的不足,提出了两种基于网络流量分析技术的Web站点流量的识别方案:基于突发流量和确认数据包总数的支持向量机的Web站点流量识别;基于包长n元条件概率的K-最邻近的Web站点流量识别。实验表明当Web浏览不采取基于流量特征变换的防御措施时,本论文两种识别方案中所挖掘的流量特征组合均能对不同Web站点的流量进行有效的分类识别,并且识别效果要比参考方案的要好或者较为接近;当Web浏览采取了其中带宽有效性相对较高的流量识别防御措施—流量特征变换时,尽管本论文中基于包长n元条件概率的K-最邻近的Web站点流量识别方案获得的识别效果要略差于其中较优的参考方案,但识别效果要比其中较差的参考方案的要好。最后对论文的工作进行总结,讨论了论文工作的不足与将来的工作展望。