论文部分内容阅读
随着物联网应用、移动边缘计算、大数据应用的快速发展,数据爆发式增长成为万物互联时代下的主旋律。传统块设备文件系统逐渐无法应对大数据存储服务对强时效、高可靠、易扩展和低功耗的需求,成为制约上层应用快速发展的关键因素之一。近年出现诸多具有非易失性、可字节寻址、低延迟、低功耗和高存储密度等优势的持久化内存(Persistent Memory,简称PM),给文件系统的发展带来了新机遇,使突破“存储墙”变得可能。然而,持久化内存普遍具有写耐受度低的缺陷,给文件系统的设计带来了新的挑战。
因此,针对基于新型持久化内存的文件系统面临的挑战与机遇,本文专注研究文件系统的写优化技术。首先研究持久化内存文件系统的虚拟超级页文件数据组织机制,降低文件写操作、文件数据的软件查找和空间管理开销,提升文件系统性能。其次,提出持久化内存文件系统的写磨损优化机制,实现低开销、高精度的磨损均衡,以提升持久化内存的使用寿命。最后,提出基于小容量持久化内存辅助回写的混合存储文件系统,减少数据回写块设备的开销,提升文件系统的性能。本文主要进行了如下三个方面的研究工作:
①持久化内存文件系统写性能优化研究。针对现有超级页文件数据组织策略存在覆盖写开销大和空间利用率低的问题,本文提出虚拟超级页文件数据组织机制(Virtual Superpage Mechanism,简称VSM)。为降低覆盖写实现数据一致性的写放大率,VSM采用多粒度写时复制数据一致性机制,根据更新数据的大小,通过修改文件数据索引结构和页表实现覆盖写的数据一致性,以提高持久化内存文件系统的性能。同时,为提高空间利用率和降低数据迁移开销,提出零拷贝文件数据迁移机制,避免数据迁移的拷贝开销。
②持久化内存文件系统的索引节点写磨损优化研究。由于索引节点具有修改频次高、数据粒度小和存储位置固化的特性,索引节点表极易被磨损坏。对此,本文提出轻量级多粒度磨损均衡机制(Lightweight and Multi-grained Wear-leveling Mechanism,简称LMWM),避免索引节点表的过度磨损。LMWM充分考虑索引节点的特性,实现缓存行(64字节)和数据页(4096字节)混合粒度的索引节点表磨损均衡机制,以降低数据迁移开销并提高磨损均衡精度。
③混合存储文件系统的写性能优化研究。传统块设备文件系统通常使用基于动态随机存取存储器(DRAM)的页高速缓存机制来提高文件系统的性能,但是存在掉电缓存数据丢失的风险。因此,文件系统使用同步操作把DRAM缓存数据立即回写到块设备。然而,同步操作违背缓存机制的初衷,严重降低文件系统的性能。本文充分利用持久化内存的优点,提出基于小容量持久化内存的混合存储文件系统,通过设计高效的持久化内存辅助回写机制(Persistent Memory assisted Write-back mechanism,简称PMW),降低同步操作回写外存块设备的数据量和回写次数,提高文件系统的性能。
最后,本文在Linux内核里实现了所提出技术的原型,并在真实平台进行实验验证。实验结果表明所提出的虚拟超级页机制能有效提高持久化内存文件系统的性能;提出的轻量级多粒度磨损均衡机制实现了低开销高精准的索引节点表磨损均衡,提高了持久化内存的使用寿命;还验证了提出的持久化内存辅助回写机制能有效减少I/O操作,提高文件系统的性能。
因此,针对基于新型持久化内存的文件系统面临的挑战与机遇,本文专注研究文件系统的写优化技术。首先研究持久化内存文件系统的虚拟超级页文件数据组织机制,降低文件写操作、文件数据的软件查找和空间管理开销,提升文件系统性能。其次,提出持久化内存文件系统的写磨损优化机制,实现低开销、高精度的磨损均衡,以提升持久化内存的使用寿命。最后,提出基于小容量持久化内存辅助回写的混合存储文件系统,减少数据回写块设备的开销,提升文件系统的性能。本文主要进行了如下三个方面的研究工作:
①持久化内存文件系统写性能优化研究。针对现有超级页文件数据组织策略存在覆盖写开销大和空间利用率低的问题,本文提出虚拟超级页文件数据组织机制(Virtual Superpage Mechanism,简称VSM)。为降低覆盖写实现数据一致性的写放大率,VSM采用多粒度写时复制数据一致性机制,根据更新数据的大小,通过修改文件数据索引结构和页表实现覆盖写的数据一致性,以提高持久化内存文件系统的性能。同时,为提高空间利用率和降低数据迁移开销,提出零拷贝文件数据迁移机制,避免数据迁移的拷贝开销。
②持久化内存文件系统的索引节点写磨损优化研究。由于索引节点具有修改频次高、数据粒度小和存储位置固化的特性,索引节点表极易被磨损坏。对此,本文提出轻量级多粒度磨损均衡机制(Lightweight and Multi-grained Wear-leveling Mechanism,简称LMWM),避免索引节点表的过度磨损。LMWM充分考虑索引节点的特性,实现缓存行(64字节)和数据页(4096字节)混合粒度的索引节点表磨损均衡机制,以降低数据迁移开销并提高磨损均衡精度。
③混合存储文件系统的写性能优化研究。传统块设备文件系统通常使用基于动态随机存取存储器(DRAM)的页高速缓存机制来提高文件系统的性能,但是存在掉电缓存数据丢失的风险。因此,文件系统使用同步操作把DRAM缓存数据立即回写到块设备。然而,同步操作违背缓存机制的初衷,严重降低文件系统的性能。本文充分利用持久化内存的优点,提出基于小容量持久化内存的混合存储文件系统,通过设计高效的持久化内存辅助回写机制(Persistent Memory assisted Write-back mechanism,简称PMW),降低同步操作回写外存块设备的数据量和回写次数,提高文件系统的性能。
最后,本文在Linux内核里实现了所提出技术的原型,并在真实平台进行实验验证。实验结果表明所提出的虚拟超级页机制能有效提高持久化内存文件系统的性能;提出的轻量级多粒度磨损均衡机制实现了低开销高精准的索引节点表磨损均衡,提高了持久化内存的使用寿命;还验证了提出的持久化内存辅助回写机制能有效减少I/O操作,提高文件系统的性能。