论文部分内容阅读
随着WWW的访问流量在Internet的访问中占据越来越重要的地位,研究WWW访问特性成为提高网络的有效合理使用的重要手段。本文首先对WWW访问特性做了分析研究,包括对Web定律之一的Zipf定律的深入探索,对一个Web服务器和两个代理服务器的日志分析,全面阐释了WWW访问的物理特性,在此基础上,我们对现有WWW的访问模型-自相似模型作了修改,使其能够反映我们所发现的特性。根据分析日志得到的访问特性,我们提出一种能够预测未来访问的缓存替换策略,并设计和实现了一种利用我们提出的新的替换策略的代理缓存机群。本文有以下贡献:对Web页面请求的Zipf-like模型的参数α进行了深入研究,并得出结论:α值与Web页面访问频率增加、减少的分界线有关,在给定的条件下(Web总页面数一定),α可以确定Web页面访问频率增加与减少的分界线,α增长说明访问更加集中在某些Web页面上。对一个典型的Web服务器和两个代理服务器的日志进行了分析,并将Web页面请求分布、Web静态文档大小的分布、Web静态文档的访问距离的分布、Web静态文档访问间隔时间分布同既有文献的结果进行了对比,有些结论是相同的,有些不同,可以视为我国WWW访问所特有的访问特性。根据对日志的分析,由于业务源的开关时间并不服从指数β∈(2,3)的幂分布,而整个业务流仍表现出较强的自相似性,我们在现有的WWW业务流的自相似模型的基础上对其进行了修改,将β∈(1,2)的情况包括进去。根据分析日志所得到的Web页面请求分布、Web静态文档的大小分布、Web静态文档访问间隔时间分布的特性,在SIZE替换策略的基础上提出了一种新的代理缓存替换策略-Predict Size替换策略。设计并实现了一种基于Linux操作系统及Squid缓存软件的代理缓存机群,对Squid的核心替换策略做了修改,使用了我们提出的Predict Size替换策略,并进行了性能测试。