论文部分内容阅读
遍及全球的互联网正在使人类的信息传递发生革命性的变化,然而由于Client/Server结构网络流量分布的不均衡性使得互连网局部网络信息传递性能随着网络流量的增加而恶化,并逐渐成为互联网发展的一大瓶颈,用户往往需要忍受较长时间的访问延迟。CDN(Content Delivery Network)的出现就是为了解决这一问题。CDN的思想就是在现有的互联网中建立一个中间层,设置若干个缓存服务器(内容服务器)来存储网站的内容,使内容分布在网络边缘更接近用户,利用设置在网络边缘、距离用户较近的内容服务器来做到为网络加速的目的,减少网络中冗余数据的重复传输,将重复的数据由本地缓存服务器直接发送给用户,从而达到提高请求响应速度、节约带宽资源的目的。CDN能够成功的一个至关重要的原因就是用户能够就近从CDN缓存服务器上读取到用户需要的内容,提高内容缓存的命中率是提升CDN应用效率的重要因素之一。由于缓存服务器的容量有限,把所有内容缓存下来是不现实的,所以缓存服务器只能通过某些策略来来替换访问率低的内容,存储重复访问的可能性高的内容。替换策略是缓存管理的重要部分,替换策略就是要设计某种策略周期性的清除网络用户不感兴趣的内容,为更流行的内容保留足够的空间以便得到更高的命中率。替换策略的有效性和Web业务特性是息息相关的。如果缓存中的替换策略不能反映业务的访问模式,那么缓存服务器就不能得到高的请求命中率。本文针对用户访问量最多的Web内容进行分析,通过分析Web轨迹文件,找出用户访问Web内容的访问特性:1、用户对内容的请求在时间上呈现局部性:用户倾向于再次访问近来访问过的文档,即用户访问内容时候具有兴趣重叠的特性。2、用户总是倾向于访问较小的内容:用户访问Web内容的时候,更倾向于访问那些内容大小较小的内容。最后根据这些特性来判断用户访问内容被再次访问的可能性,通过对每个特性进行描述,得到一个权值来表示内容再次被访问的可能性,我们称它为引用率,以引用率作为衡量内容是否被替换的依据,提出内容分发网络缓存替换策略,提高了缓存内容访问命中率。最后通过数值仿真计算来与现有替换策略进行比较,说明该替换策略的优越性。