论文部分内容阅读
近年来,互联网技术的快速发展和网民数量的激增,给内容源服务器和传输骨干网络带来越来越大的压力,互联网瓶颈也从接入段逐渐向骨干传输网络和服务器端转移。内容分发网络(CDN,Content Delivery Network)在多个骨干网和不同的ISP部署数量不等的内容服务器,当用户请求到达时,会综合用户位置、内容服务器负载等参数为用户选择较近的内容服务器,从而实现跨运营商、跨地域的用户覆盖。CDN不仅提高了用户的终端体验,减轻了原始服务器的负载,而且将用户大规模并发带来的流量激增压制在IP网络边缘,有效地避免了对骨干网地冲击。
目前,CDN已经渗透到互联网的各个领域,成为互联网架构中十分重要的一部分,但是关于中国大陆的CDN测量和分析还比较少。另外,国外CDN测量中所使用的测量技术中,通常使用开放LDNS(Local DNS)服务器和PlanetLab节点作为测量点,但是由于LDNS服务器和PlanetLab节点在国内数量不足,这种测量方法并不能挪用到中国大陆的CDN测量研究。
本文提出了一种基于HTTP代理服务器作为测量源的CDN测量技术。我们首先利用爬虫爬取大量的HTTP代理,然后对收集到的代理整理分类,并筛选出稳定高性能的代理,这些代理在地理位置和ISP上均有着比较全面地覆盖,适合作为国内CDN网络测量的客户端,有效解决了国内开放LDNS服务器和Planetlab节点数不足的问题。接下来,通过对TCP流地追踪分析,本文详细介绍了蓝汛、网宿科技的DNS重定向过程,以及优酷、土豆和新浪视频的URL重写过程。利用它们的重定向机制,我们设计了测量平台和测量技术,并进行了83天地网络测量。
整个测量分三个部分:HTTP代理收集、CDN节点获取和CDN时延测量。通过HTTP代理模拟用户行为,本文获取到不同CDN服务商的CDN节点以及对应的时延数据。测量完成后,对收集到的数据进行了详细地分析和讨论。本文分别从CDN节点分布、时延性能、负载均衡和节点调度等几个方面对蓝汛、网宿科技以及优酷、土豆和新浪视频进行了对比分析。针对优酷、土豆和新浪视频的CDN节点,本文进行了地理定位和ISP划分,并在数据分析中发现,优酷、土豆和新浪视频的CDN节点调度具有偏向性,即更倾向于选择和客户端同处于一个ISP的内容服务器,最后本文从路径膨胀的角度分析了这种现象产生的原因。