论文部分内容阅读
在大数据时代,如何存储海量数据成为一个巨大挑战。由于具有低成本、大容量的优点,磁盘仍将长期在存储系统中发挥重要作用。受超顺磁效应的影响,传统磁盘面密度的增长已达到极限,而瓦记录技术能够在传统磁记录技术的基础上以较低的成本进一步提高磁盘面密度。瓦记录磁盘不仅已应用在消费级场景,而且已逐步部署在亚马逊、华为、脸书等公有云厂商或社交网络公司的数据中心中。对瓦记录磁盘的管理可以在磁盘内部、主机端、主机端和磁盘协作这三个层面实现,据此,瓦记录磁盘可以分为三种:驱动器管理的瓦记录磁盘、主机管理的瓦记录磁盘、主机感知的瓦记录磁盘。然而由于瓦记录技术存在写放大问题,瓦记录磁盘的性能在写密集的工作负载下通常会严重下降。针对上述挑战,本文针对三种不同的瓦记录磁盘在数据布局、利用主机资源优化磁盘性能等方面展开了研究,以提高瓦记录磁盘性能,使其得到更广泛的应用。
针对驱动器管理的瓦记录磁盘数据清理形成的性能瓶颈问题,提出分区权重感知的瓦记录磁盘性能加速方法(Zone-weightAwarePerformanceacceleration,ZAP),提高驱动器管理的瓦记录磁盘性能。磁介质缓存向瓦记录分区清理数据引起数据迁移,导致性能下降。已有的研究仅对磁介质缓存数据清理策略进行优化,忽视了工作负载访问特征和数据布局对瓦记录磁盘性能的影响。ZAP结合工作负载的写访问特征,计算瓦记录分区的权重,分别设计了分区权重感知的数据布局策略和数据清理策略。数据布局策略将部分权重较大的瓦记录分区采用动态映射方式管理,减少写向磁介质缓存的数据,而数据清理策略优先选择权重最小的瓦记录分区执行数据清理,两者可有效减少数据清理引起的数据迁移,从而提高瓦记录磁盘性能。ZAP还设计了局部读-更改-写操作,计算并只迁移瓦记录分区中受写数据影响的数据,进一步减少了数据清理引起的数据迁移,提高了瓦记录磁盘性能。与当前针对驱动器管理的瓦记录磁盘的优化方法相比,ZAP的带宽提高了33%,延迟降低了30%。
针对主机管理的瓦记录磁盘垃圾回收导致性能下降问题,提出基于负载局部性的瓦记录磁盘管理方法(WorkloadlocalitybasedmanagementApproachtoHost-managedSMRdrives,WAH),提高主机管理的瓦记录磁盘性能。现有的研究仅对垃圾回收策略进行优化,较少考虑工作负载的局部性特征以及空间分配策略对瓦记录磁盘性能的影响。WAH方法充分利用了工作负载冷热数据分布的局部性特征,设计了基于负载局部性的空间分配策略和与之相适应的垃圾回收策略。空间分配策略通过分配瓦记录分区将冷数据和热数据分别相对集中存储,初步实现了冷热数据分离,而垃圾回收策略则在瓦记录分区数据合并过程中将冷数据和热数据分别合并于不同的瓦记录分区,进一步实现了冷热数据分离,从而有效减少了垃圾回收过程中主机管理的瓦记录磁盘所迁移的数据,提高了瓦记录磁盘的性能。相比当前针对主机管理的瓦记录磁盘的其它优化方法,WAH方法可将瓦记录磁盘的平均带宽提高16%,将平均延迟降低29%。
充分利用瓦记录分区对主机开放的地址信息,提出面向瓦记录分区写请求顺序化的固态盘缓存方法(SSDcachingappROachtowriterequestsequentializationforshingledmagneticreCOrdingzones,ROCO),提高主机感知的瓦记录磁盘性能。已有研究仅优化主机感知的瓦记录磁盘的数据组织方式,没有充分利用瓦记录分区对主机开放的地址信息,也较少考虑非顺序写数据的访问特征,这使得非顺序写数据导致主机感知的瓦记录磁盘性能下降。分析发现非顺序写数据主要由乱序写数据和更新数据组成,ROCO结合瓦记录分区开放的地址信息,设计了面向瓦记录分区的写请求顺序化策略,将乱序写数据转化为顺序写数据,同时使用固态盘缓存更新数据,并设计了面向瓦记录分区的固态盘缓存替换算法,结合主机读-更改-写操作,优先面向瓦记录分区替换顺序写数据,其次替换属于同一瓦记录分区的更新最少的数据。ROCO有效减少了写向主机感知的瓦记录磁盘的非顺序写数据,提高了瓦记录磁盘的性能。实验表明,与不使用固态盘缓存相比,ROCO的性能可以提高82%,与使用了固态盘缓存的其他方法相比,ROCO的性能可以提高45%。
针对驱动器管理的瓦记录磁盘数据清理形成的性能瓶颈问题,提出分区权重感知的瓦记录磁盘性能加速方法(Zone-weightAwarePerformanceacceleration,ZAP),提高驱动器管理的瓦记录磁盘性能。磁介质缓存向瓦记录分区清理数据引起数据迁移,导致性能下降。已有的研究仅对磁介质缓存数据清理策略进行优化,忽视了工作负载访问特征和数据布局对瓦记录磁盘性能的影响。ZAP结合工作负载的写访问特征,计算瓦记录分区的权重,分别设计了分区权重感知的数据布局策略和数据清理策略。数据布局策略将部分权重较大的瓦记录分区采用动态映射方式管理,减少写向磁介质缓存的数据,而数据清理策略优先选择权重最小的瓦记录分区执行数据清理,两者可有效减少数据清理引起的数据迁移,从而提高瓦记录磁盘性能。ZAP还设计了局部读-更改-写操作,计算并只迁移瓦记录分区中受写数据影响的数据,进一步减少了数据清理引起的数据迁移,提高了瓦记录磁盘性能。与当前针对驱动器管理的瓦记录磁盘的优化方法相比,ZAP的带宽提高了33%,延迟降低了30%。
针对主机管理的瓦记录磁盘垃圾回收导致性能下降问题,提出基于负载局部性的瓦记录磁盘管理方法(WorkloadlocalitybasedmanagementApproachtoHost-managedSMRdrives,WAH),提高主机管理的瓦记录磁盘性能。现有的研究仅对垃圾回收策略进行优化,较少考虑工作负载的局部性特征以及空间分配策略对瓦记录磁盘性能的影响。WAH方法充分利用了工作负载冷热数据分布的局部性特征,设计了基于负载局部性的空间分配策略和与之相适应的垃圾回收策略。空间分配策略通过分配瓦记录分区将冷数据和热数据分别相对集中存储,初步实现了冷热数据分离,而垃圾回收策略则在瓦记录分区数据合并过程中将冷数据和热数据分别合并于不同的瓦记录分区,进一步实现了冷热数据分离,从而有效减少了垃圾回收过程中主机管理的瓦记录磁盘所迁移的数据,提高了瓦记录磁盘的性能。相比当前针对主机管理的瓦记录磁盘的其它优化方法,WAH方法可将瓦记录磁盘的平均带宽提高16%,将平均延迟降低29%。
充分利用瓦记录分区对主机开放的地址信息,提出面向瓦记录分区写请求顺序化的固态盘缓存方法(SSDcachingappROachtowriterequestsequentializationforshingledmagneticreCOrdingzones,ROCO),提高主机感知的瓦记录磁盘性能。已有研究仅优化主机感知的瓦记录磁盘的数据组织方式,没有充分利用瓦记录分区对主机开放的地址信息,也较少考虑非顺序写数据的访问特征,这使得非顺序写数据导致主机感知的瓦记录磁盘性能下降。分析发现非顺序写数据主要由乱序写数据和更新数据组成,ROCO结合瓦记录分区开放的地址信息,设计了面向瓦记录分区的写请求顺序化策略,将乱序写数据转化为顺序写数据,同时使用固态盘缓存更新数据,并设计了面向瓦记录分区的固态盘缓存替换算法,结合主机读-更改-写操作,优先面向瓦记录分区替换顺序写数据,其次替换属于同一瓦记录分区的更新最少的数据。ROCO有效减少了写向主机感知的瓦记录磁盘的非顺序写数据,提高了瓦记录磁盘的性能。实验表明,与不使用固态盘缓存相比,ROCO的性能可以提高82%,与使用了固态盘缓存的其他方法相比,ROCO的性能可以提高45%。