论文部分内容阅读
网络的快速发展和广泛普及、信息化发展、网络融合业务的不断增加对Web服务器技术及系统提出了更高的要求。一方面,动态网页和HTTPS的广泛使用,需要更多的服务器资源;另一方面,随着网络带宽的不断增大,用户对网页、网站的响应速度要求越来越高。
为了扩充Web服务器系统的处理能力,通常采用Web集群系统。人们提出了多种Web集群结构,其中基于前端的集群结构作为最佳方案应用最为广泛。针对基于前端的Web集群,本文对以下几个关键技术展开了研究:1)如何将数据库UDI查询(Update、Delete、Insert)分布到多个数据库,提高数据库系统的扩展性;2)动态请求产生的负载差异很大且难以预测,如何实现负载均衡;3)如何在基于内容的请求路由机制中加入对持久连接和流水线请求的支持;4)如何对请求进行准确分类以便为重要的请求提供更好的服务。
本文的主要贡献如下:
1、提出了一种基于用户的数据分割存储方案:针对论坛和博客服务提供商网站,将数据按照所属用户进行分割,存储到不同的数据库系统上。该方案能够将UDI查询分布到多个数据库系统上,增加了系统的扩展性。
2、针对动态请求,提出了基于分类的请求调度策略,根据URL模式对动态请求分类,同一类的请求具有相同的负载特性,因而可以在不估计请求负载的情况下,实现负载的均衡。试验表明:该策略与基于用户会话得调度方法相比,性能提高了50%以上。
3、提出了自适应分离式调度策略ASSP。以往研究表明,用不同的服务器服务静态请求和动态请求,可以提高系统的性能。ASSP在运行时根据负载情况,自动调整用于服务静态请求和动态请求的服务器数量。在各种试验环境下,ASSP性能都优于对服务器进行静态分配的最佳方案。
4、分析了基于内容的请求路由机制TCPHA,为每个连接加入了WAITRESPONSE状态,保证上一个请求的回复发送完毕后再进行迁移,从而实现了对HTTP/1.1中持久连接和流水线请求的支持,使得TCPHA在我们的试验环境中性能至少提高61.1%。
5、提出了一种通用的请求分类方法:定义网站的目标页面,根据网站的日志文件,计算出各页面跳转到目标页面的概率即目标概率,页面的目标概率越大,页面越重要。仿真试验表明,将此分类方法用于接纳控制,在系统超载时丢弃目标概率最小的请求,可以提高到达目标页面的的用户数,对电子商务网站,这意味着更多成功的交易。