论文部分内容阅读
发布/订阅系统,作为一种新型的分布式架构,具有松耦合和异步通信等特点,是大数据环境下最有前景的网络架构之一。缓存机制作为发布/订阅系统的一个关键技术,关于它的研究对于解决大数据给网络所带来的难题具有重大意义。 大数据环境下,现有缓存策略存在负载不均衡、时变性差等诸多缺点,对于发布/订阅系统整体性能的提高效果欠佳。本文在缓存选择和副本分配策略(CSRAS)的基础上,针对它存在的不适应性进行了改进,提出了单副本静态缓存策略(SCSSR)。围绕发布者不在线状态和热点事件这两种常见场景,分别提出了两种不同的缓存策略,基于发布者不在线状态的混合缓存策略(MCS-POS)和基于热点事件的混合缓存策略(MCS-HE)。论文内容及工作如下: 1.结合大数据的特点,讨论了发布/订阅系统缓存策略的设计要求。在CSRAS的基础上,针对它存在的不适应性进行了改进,提出了新的缓存策略SCSSR。该策略在缓存分配时设定每一个主题至多分配一个副本,同时把基于主题和基于Map相结合,合理地增强代理节点订阅信息和广告信息的表达能力,这增加了代理节点网络缓存事件的多样性,有利于代理节点表达当前时刻真正感兴趣的事件和拥有的事件。仿真结果表明,和CSRAS相比,SCSSR可以有效地减少系统中的冗余事件和请求流量,一定程度上降低网络时延。 2.讨论了现有动态缓存策略的优缺点,说明了在静态缓存策略的基础上,增加动态缓存策略的必要性。在SCSSR的基础上,围绕发布者不在线状态和热点事件这两种常见场景,分别提出了两种不同的缓存策略,MCS-POS和MCS-HE。(1)在MCS-POS中,发布者切换到不在线状态时刻之前的一段时间内,增大不在线发布者提供事件在代理节点网络存储的概率,这有利于增加发布者处于不在线状态期间,系统缓存中不在线状态发布者提供事件的数量。仿真结果表明,相比于SCSSR,使用MCS-POS时,对不在线状态发布者提供事件的请求信息始终能够大概率地得到响应,有利于提高发布/订阅系统的服务质量。(2)在MCS-HE中,发布者/代理节点周期性地检测是否有事件成为热点事件,发现某个事件成为热点事件后,合理增加该事件在代理节点网络的副本数,副本优先缓存在该事件请求速率较大的代理节点。仿真结果显示,相比于SCSSR,使用MCS-HE时,对热点事件请求信息的缓存命中概率得到了提高,与此同时,请求信息整体上在缓存的命中概率也得到了提高,有利于负载均衡,进而提高发布/订阅系统的整体性能。