论文部分内容阅读
Web缓存是一个提高Web性能非常有效的方法,它可以位于网络的不同位置:客户端,代理服务器端,服务器端。研究表明Web缓存命中率可以达到30%-50%。Web缓存可以大大提高Web系统的性能,但同时也提出许多问题,Web缓存在应用中最大的问题就是Web缓存管理,研究Web访问特征是有效进行Web缓存管理的基础,对Web网站的规划设计也具有非常积极的作用。近年来,通过对Web用户的行为跟踪,对Web对象访问特征的深入研究分析,发现Web对象访问具有以下几个共同特征:(1) Web对象访问频率服从类齐普夫法则(zipf-like law);(2) Web对象大小服从重尾分布;(3) 50-70%的Web对象只被访问一次;(4) Web对象访问具有时间局部性;(5) Web对象访问具有空间局部性。 Web日志生成模拟器可以按用户指定的Web访问特征生成理想的模拟日志,对于研究Web缓存系统性能有很大地帮助,目前有两种方法模拟生成Web访问日志:日志驱动方法与数学模拟方法。日志驱动方法利用对历史日志进行变换来模拟生成新的日志;数学模拟方法是在充分研究Web对象访问特征的基础上,通过建立数学模型来模拟生成Web日志。 本论文首先通过分析Web对象访问特征,采用数学模拟方法分别模拟了Web对象高频区及低频区流行度特征、Web对象大小重尾分布特征、Web访问的时间局部性特征,设计并实现了一个Web日志模拟生成器WEBSIM。该模拟器不仅可以模拟生成Web对象访问日志,而且具有较大的灵活性,为进一步研究Web缓存技术和预取技术提供依据;本论文还利用WEBSIM模拟器生成的访问日志以及Cao Pei的Web替换算法性能测试仿真器对常用的Web缓存替换算法进行了细致的性能评估,通过实验进一步证明:在满足Zipf法则的前提下,LFU算法是比较好的选择。