论文部分内容阅读
Web代理缓存技术是改善网络性能,缓解网络瓶颈最有效的方法。文章从缓存替换算法、一致性策略和共享技术等7个方面对代理缓存技术的国内外研究现状进行了深入的分析。在此基础之上,着重对代理缓存的替换算法、缓存机群结构及缓存上的个性化服务技术进行了研究。 首先,文章指出了现有替换算法——最近最少使用缓存替换算法的缺点,并分析了用户的访问模式,对替换算法的一般化模型进行了优化。在替换算法的费用函数中加入了引用率、文件大小和单位价值参数,形成了自适应最少费用替换算法,并通过实验比较了两种算法的命中率性能。 其次,文章分析了目前最流行的代理缓存机群结构——Internet Cache Protocol系统的优势与不足,借鉴其优点改进其不足,提出了改进的缓存机群结构——自适应的集中管理式Web缓存系统。自适应的集中管理式Web缓存系统的设计目标是动态分析热对象,自动预取和数据流与控制流的分离。通过理论推导,就自适应的集中管理式Web缓存系统与Internet Cache Protocol系统在命中率、系统开销和访问延迟方面进行了性能比较。 再次,文章阐述了使用Squid软件搭建代理缓存机群的相关方法,并且运用负载均衡器达到统一管理缓存资源,负载均衡和IP重定向的目的。 最后,为了进一步提高命中率,文章对缓存系统的个性化服务技术进行了探索。通过对Web数据挖掘技术的研究,提出了将WebWatcher技术移植到代理缓存上,进而实现代理缓存的个性化服务。文章还分析了现有个性化服务技术的不足,提出了进一步有待研究的问题。