论文部分内容阅读
随着互联网技术的飞速发展,网络应用的主体逐步向内容获取和信息服务演进。传统的TCP/IP架构在解决内容分发问题时存在可扩展性差,灵活性不够等诸多不足。在这种背景下,以信息为中心的网络(Information-Centric Networking,ICN)被提出并受到广泛关注。ICN架构的成功依赖于网元设备两个方面的能力:(1)提供大容量的内容存储;(2)线速地处理网络流量。然而当前能够提供大容量存储的块设备的I/O速度无法满足网元设备的高线速要求,引入块设备后将给网元设备的转发性能带来极大影响。如何设计一个能够同时满足上述要求的缓存节点是一个亟需解决的问题。近年来,软件定义网络(Software Defined Networking,SDN)由于其控制和转发分离的特性,广泛应用于网络管理、架构设计等多个领域,这也为ICN节点的设计带来了新的契机。本文基于SDN技术,首先考虑单个缓存节点的设计问题,提出了一种支持TB级别缓存的分离式架构,进而基于该架构,从缓存插入过滤、缓存决策策略等方面提高整个缓存网络的性能,主要研究工作与创新如下:1.提出了一种支持TB级别缓存的分离式架构针对网络设备在使用块设备作为内容存储时所面临的低速I/O与高速转发不匹配的问题,基于协议无感知转发(Protocol Oblivious Forwarding,POF)技术,提出了一种将网络设备切割为交换单元和存储单元的分离式架构。该架构通过将缓存操作从转发操作中彻底解耦,保障交换单元的转发性能不受I/O操作的影响;通过存储端口的扩展,使得交换单元可以依据负载均衡策略将每个存储单元需要处理的负载减小到不超过SSD的吞吐限制,多个存储单元从而可以利用大容量的SSDs来满足TB级别的容量需求。该架构充分考虑了交换单元完全可编程的特点,将存储单元处理的协议固定为SSCP(Switch end and Storage end Communication Protocol)协议,而在交换单元实现外部网络协议与SSCP协议之间的双向转换。为了应对分离架构下的报文依赖问题,本文提出了一种基于线性表的数据平面状态存储方法;为了加速协议转换,本文提出了一系列优化方法,包括设计专有操作实现SSCP头部的快速封装,减少SSCP负载构造过程中的报文数据拷贝等。实验结果表明,基于线性表的数据平面状态存储方法,可以有效改善POF交换机在处理状态存储需求应用时的时延和吞吐性能;分离架构相对传统内置存储设备架构,交换单元的处理时延降低1到2个数量级;在不考虑网卡开销和采用多线程处理情况下,交换单元处理简化的ICN报文或SSCP报文的吞吐速率可达9 Mpps。2.提出了一种轻量级的缓存插入过滤机制针对当前典型的负载请求特征是很长一段时间内大部分内容只会被访问一次,以及SSD具有受限的生命周期的特点,提出了一种基于LRU队列和Hash表的轻量级的缓存插入过滤机制。该方法利用LRU队列来控制统计周期和缓存替换,使用Hash表记录在这段统计周期内内容的请求次数,通过将访问次数低于指定阈值的内容过滤掉,减少SSD的写入次数,提高层次存储系统的可用性。该方法充分考虑了 Hash表的查询开销所带来的性能问题,通过将Hash表的每一个桶大小与CPU缓存行对齐,保证一次读取操作就能将整个桶放置在CPU的L1级缓存中,减少碰撞发生时对慢速内存的多次读取。基于2种典型流行度分布的维基百科日志与合成日志的实验表明,所提机制只需要大约200个时钟周期的处理开销,不到处理一对兴趣/内容报文所消耗的平均时钟周期的1%;在单层存储系统上,相比无过滤机制,两种请求负载的缓存命中率分别提升了 10.27%和48.6%;在层次化存储系统上,相比一种轻量级的见习式插入过滤机制,所提机制可以减少SSD的写入次数,同时不会带来缓存命中率的下降。3.提出了一种基于排名匹配的缓存决策策略针对当前信息中心网络默认处处缓存策略带来的缓存冗余问题,提出了一种基于内容流行度排名与节点介数排名匹配的缓存决策策略PRIRM。该策略在缓存内容时充分考虑内容的流行度与节点的介数,在内容沿途返回到用户的过程中,根据节点在分发路径上的排名与内容的流行度排名是否匹配,实现内容的最佳放置。为了估算内容流行度排名,该策略要求本地节点维护一个内容流行度表,记录内容的请求次数。为了避免流行度表膨胀所带来的内存开销与查询开销,本文提出了一种基于时间窗口来实时更新流行度表的方法,将该时间窗口内未被请求的内容记录删除。在ndnSIM平台的仿真结果表明,在PRIRM策略中,基于时间窗口估计内容流行度的方法可以获取和全局流行度相当的性能。与现有文献提出的处处缓存策略,基于中心度的缓存策略,基于路径容量的概率缓存策略相比,PRIRM策略能够实现一个层次化的内容分布,从而有效减少不同节点之间的缓存冗余。在内容总数、流行度分布参数和网络拓扑结构变化时,PRIRM策略都能获得最小的缓存命中跳数。上述方法已部分应用于中国科学院战略性先导科技专项“未来网络架构研究与边缘设备研制(XDA06010302)”课题之中。