论文部分内容阅读
分布式数据库系统中,数据分散存储在不同的数据节点。由于不同节点数据访问频率的多变性和差异性,导致各个节点的负载不均衡,降低了系统整体性能。因此,高效动态地组织管理系统缓存以提高分布式数据库整体性能,是当前的热点研究问题之一。自适应多级缓存机制采用实时动态分配缓存资源的技术,在提高分布式数据库系统查询响应速度的同时解决了热数据节点导致的系统瓶颈问题。提出了一种两层架构的并发执行策略,根据访问数据节点和数据表将并发SQL(Structured QueryLanguage)粗粒度地划分为多个可并发执行队列,提高SQL的并发执行速度;提出一种分区分级缓存管理策略,将缓存项按存储节点和数据表分区存储,按优先级分层管理,提高缓存匹配速度;将虚拟缓存技术引入缓存管理中,通过动态调整虚拟缓存与物理缓存映射关系将更多的缓存资源的分配给分布式数据库系统中响应速度慢的节点,解决了热数据节点导致的系统性能瓶颈问题;提出了自适应的缓存替换算法RFS(Replacement For Semantic)代替传统的LRU(Least Recently Used)方法,查询执行时间、历史命中时间间隔、命中类型以及缓存项所占空间大小作为替换权值的衡量指标,提高缓存命中率。系统测试与结果分析表明:在分布式数据库系统环境下,自适应多级缓存机制相比于单级静态缓存机制,整个系统响应速度提高了15%以上;相比于无缓存机制,响应速度提高了30%。RFS相比于传统的LRU缓存替换算法在性能上提升了20%。