论文部分内容阅读
信息技术的发展促使数据规模急剧增长,进一步推动了云计算技术的发展与成熟,使得越来越多的企业和个人将业务或应用迁移到云计算平台上。在云计算平台中,云服务提供商往往采用共享服务架构,并通过虚拟化技术向用户交付服务。比如将租户应用部署在虚拟机内,而虚拟机共享计算、存储和网络等物理资源。共享服务架构能够提高资源利用率并降低管理成本,但会引入资源竞争,使得租户间的性能相互干扰。云存储系统作为存储服务的载体,是云计算平台的核心组件。如何通过云存储系统向租户提供可靠以及受保障的存储服务成为一个非常重要的研究课题。然而多样的租户需求以及复杂的云存储系统I/O栈为租户间的性能隔离带来挑战,针对这一挑战本文采用软件定义的方法分别在分布式文件系统层、存储节点端本地文件系统层以及存储介质层提出相应的性能隔离方法。
针对分布式文件系统层租户请求和数据恢复请求之间的冲突,提出基于数据恢复感知的性能隔离方法CoPR。在云存储系统中,性能隔离是一种不可或缺的技术手段。但当分布式文件系统向租户提供存储服务时,会不可避免地出现故障。为保障租户数据的可靠性,分布式文件系统需尽快恢复丢失的数据。租户请求和数据恢复请求争用共享资源导致两者之间产生冲突。现有研究方案往往只能保障租户性能或数据恢复性能中的一个方面,无法解决两者之间的冲突。针对以上问题,CoPR在分布式文件系统层实现数据恢复感知的性能隔离,兼顾租户性能和数据恢复性能。具体而言,CoPR实现一个双层调度架构,第一层调度器通过强化学习的方法实现租户请求和数据恢复请求之间的资源分配,在不引起租户SLO(Service Level Objective)违约的前提下将剩余资源分配给数据恢复请求,进而优化数据恢复性能;第二层调度器采用软件定义的方法,在控制平面将租户的性能需求记录在虚拟块设备的元数据内,在数据平面则根据租户的性能需求实现虚拟块设备粒度的资源分配。实验结果表明,CoPR相比于Ceph能够实现性能隔离的目标,并减少35.8%-55.8%的数据恢复时间。
针对存储节点端本地文件系统对存储资源使用的影响,提出基于文件系统行为感知的性能隔离方法SDFS。在云计算平台中,计算节点和存储节点能够通过网络文件系统互连,虚拟机运行在计算节点上,虚拟机的虚拟磁盘以大文件形式存放在存储节点上。此时虚拟机对存储资源的使用不仅取决于应用特征,也取决于存储节点上本地文件系统的优化行为,比如延迟写机制会推迟写请求、日志机制会放大写请求等。现有隔离方案没有考虑文件系统的影响,导致存储资源的使用情况难以确定,并进一步恶化租户间的性能干扰。为解决以上问题,SDFS感知存储服务器端本地文件系统的优化行为,控制存储资源的使用,进而实现租户间的性能隔离。在控制平面,SDFS通过自定义系统调用将租户性能需求记录在虚拟机镜像文件的元数据内,然后通过跨层标记传播租户性能需求。在数据平面,SDFS分别构建页缓存I/O调度器和块层I/O调度器,并根据租户性能需求分配内存和磁盘资源。实验结果表明,SDFS相比于典型的Hypervisor层性能隔离方案Pulsar能够降低76.4%的租户间性能干扰。
针对NVMeSSD(Non-Volatile Memory express Solid-State Drive)内缓存竞争和垃圾回收带来的性能干扰,提出基于非对称资源分配的性能隔离方法CostPI。NVMeSSD具有高吞吐率、低延迟以及低功耗等优点,因此在云计算平台中得到了广泛的部署和使用。为实现基于SSD的性能隔离,现有研究方案将共享的SSD以统一粒度划分为不同的物理存储区域,再分配给不同的应用。然而现有物理隔离方案无法解决SSD内嵌入缓存层的资源竞争,此外还会导致资源不充分利用以及磨损不均衡等问题。为解决以上问题,CostPI通过非对称资源分配实现全隔离虚拟SSD和半隔离虚拟SSD,其中全隔离虚拟SSD为延迟敏感应用提供存储服务,拥有专享的资源,包括数据缓存、映射表缓存和NANDflash,而半隔离虚拟SSD为吞吐率需求和容量需求应用提供存储服务,拥有共享的资源。CostPI在控制平面通过配置文件个性化定制虚拟SSD;在数据平面根据定制策略进行请求调度和资源划分,具体包括NVMe队列层的SLO感知仲裁机制、嵌入缓存层的非对称缓存划分和NANDflash层的通道粒度闪存分配。实验结果表明,CostPI相比于典型的物理隔离方案FlashBlox能够降低44.2%-89.5%的租户间性能干扰,并提高11.4%的系统资源利用率,同时还能够优化SSD的不均衡磨损。
针对分布式文件系统层租户请求和数据恢复请求之间的冲突,提出基于数据恢复感知的性能隔离方法CoPR。在云存储系统中,性能隔离是一种不可或缺的技术手段。但当分布式文件系统向租户提供存储服务时,会不可避免地出现故障。为保障租户数据的可靠性,分布式文件系统需尽快恢复丢失的数据。租户请求和数据恢复请求争用共享资源导致两者之间产生冲突。现有研究方案往往只能保障租户性能或数据恢复性能中的一个方面,无法解决两者之间的冲突。针对以上问题,CoPR在分布式文件系统层实现数据恢复感知的性能隔离,兼顾租户性能和数据恢复性能。具体而言,CoPR实现一个双层调度架构,第一层调度器通过强化学习的方法实现租户请求和数据恢复请求之间的资源分配,在不引起租户SLO(Service Level Objective)违约的前提下将剩余资源分配给数据恢复请求,进而优化数据恢复性能;第二层调度器采用软件定义的方法,在控制平面将租户的性能需求记录在虚拟块设备的元数据内,在数据平面则根据租户的性能需求实现虚拟块设备粒度的资源分配。实验结果表明,CoPR相比于Ceph能够实现性能隔离的目标,并减少35.8%-55.8%的数据恢复时间。
针对存储节点端本地文件系统对存储资源使用的影响,提出基于文件系统行为感知的性能隔离方法SDFS。在云计算平台中,计算节点和存储节点能够通过网络文件系统互连,虚拟机运行在计算节点上,虚拟机的虚拟磁盘以大文件形式存放在存储节点上。此时虚拟机对存储资源的使用不仅取决于应用特征,也取决于存储节点上本地文件系统的优化行为,比如延迟写机制会推迟写请求、日志机制会放大写请求等。现有隔离方案没有考虑文件系统的影响,导致存储资源的使用情况难以确定,并进一步恶化租户间的性能干扰。为解决以上问题,SDFS感知存储服务器端本地文件系统的优化行为,控制存储资源的使用,进而实现租户间的性能隔离。在控制平面,SDFS通过自定义系统调用将租户性能需求记录在虚拟机镜像文件的元数据内,然后通过跨层标记传播租户性能需求。在数据平面,SDFS分别构建页缓存I/O调度器和块层I/O调度器,并根据租户性能需求分配内存和磁盘资源。实验结果表明,SDFS相比于典型的Hypervisor层性能隔离方案Pulsar能够降低76.4%的租户间性能干扰。
针对NVMeSSD(Non-Volatile Memory express Solid-State Drive)内缓存竞争和垃圾回收带来的性能干扰,提出基于非对称资源分配的性能隔离方法CostPI。NVMeSSD具有高吞吐率、低延迟以及低功耗等优点,因此在云计算平台中得到了广泛的部署和使用。为实现基于SSD的性能隔离,现有研究方案将共享的SSD以统一粒度划分为不同的物理存储区域,再分配给不同的应用。然而现有物理隔离方案无法解决SSD内嵌入缓存层的资源竞争,此外还会导致资源不充分利用以及磨损不均衡等问题。为解决以上问题,CostPI通过非对称资源分配实现全隔离虚拟SSD和半隔离虚拟SSD,其中全隔离虚拟SSD为延迟敏感应用提供存储服务,拥有专享的资源,包括数据缓存、映射表缓存和NANDflash,而半隔离虚拟SSD为吞吐率需求和容量需求应用提供存储服务,拥有共享的资源。CostPI在控制平面通过配置文件个性化定制虚拟SSD;在数据平面根据定制策略进行请求调度和资源划分,具体包括NVMe队列层的SLO感知仲裁机制、嵌入缓存层的非对称缓存划分和NANDflash层的通道粒度闪存分配。实验结果表明,CostPI相比于典型的物理隔离方案FlashBlox能够降低44.2%-89.5%的租户间性能干扰,并提高11.4%的系统资源利用率,同时还能够优化SSD的不均衡磨损。