基于纠删码的SSD自适应容错方案及其性能优化

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:zhouyi_love
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着闪存工艺尺寸的缩小以及单元内多比特存储技术的发展,闪存芯片的容量逐渐增加,但闪存的可靠性问题变得更加严重。固态硬盘(Solid State Driver,SSD)内部现有的可靠性方案(如ECC、RAID)不能很好的应对闪存的多级可靠性问题;另外,固定的可靠性方案未考虑块间磨损不平衡:在SSD前期提供了过多的冗余,从而增加了闪存的写放大,并且在SSD后期也不能容忍条带内出现多个错误的情况。
  针对上述问题,设计实现了一种自适应容错的SSD纠删码方案(Adaptive error-tolerant Erasure Coding Scheme Within SSDs,AetEC)。在SSD寿命前期,通过实时监测闪存块的磨损情况,并根据超级块中的高磨损块数应用相应纠错能力的RS(Reed Solomon)纠删码;在SSD寿命后期,进一步增加RS码的容错能力,以容忍芯片级故障。基于物理地址的条带组织方案有效地减少了校验数据的更新开销;基于双链表分区管理的写缓存方案在提高SSD性能的同时,保证了用户数据和校验数据的一致性;针对不同的错误类型,设计了不同的数据恢复方法和数据重建布局方法。另外,考虑到软件实现的RS码可能会对SSD的性能造成影响,设计了一种基于FPGA的多速率RS码的编/解码器方案。对多种RS码的解码矩阵进行预处理以省去解码矩阵的求解过程,并采用基址加变址寻址的思想优化解码矩阵索引的计算过程,使得解码和编码具有几乎一样的吞吐率。
  利用VivadoHLS工具设计实现了多速率RS码的编、解码器。测试结果表明,编码和解码具有相同的吞吐率,最大为3GB/s;和Xilinx提供的RS码解码加速方案相比,所设计的RS码解码器实现了相同的解码吞吐率,并减少了18.7%的内存使用。在仿真平台上实现了AetEC,并提出了AetEC的可靠性模型。测试结果表明,和固定的RAID4方案相比,AetEC在性能和可靠性方面都有较大的改善,并且有效地减小了闪存的写放大,即平均响应时间最多减少了32.8%,写放大最多减少了37.8%。和最新的WARD方案相比,AetEC以较小的性能开销(平均响应时间最多增加了5.9%)获得了更高的可靠性,AetEC使不可纠正的页错误率(UPER)降低了两个数量级,并且提供了容忍芯片故障的能力。
其他文献
深度神经网络的发展使得人脸识别技术取得显著进展,但是深度学习模型容易受到对抗样本的攻击。对抗样本是指故意添加细微的扰动所形成的输入样本,它会使模型判断错误。人脸识别模型同样易受对抗样本攻击,研究人脸识别模型在对抗攻击下的脆弱性有助于人们更好的了解对抗样本,从而获得鲁棒性高的模型。本文在黑盒场景下,研究人脸识别对抗攻击算法。  针对黑盒攻击成功率低的问题,提出了基于Dropout的梯度符号法。该算法
学位
微博是中国互联网最活跃的社交平台之一。对微博评论进行情感分类,对舆论控制、商业决策和反恐领域都具有重大意义。目前针对微博评论情感分类研究具有较多难点,存在文本口语化严重、同音错别字高频出现及新型网络语言层出不穷等问题,而因传统词向量缺乏对情感信息表征而导致的模型难以准确学习到文本情感信息的问题也亟待需要解决。  针对目前情感词典主要基于规范语言而忽略了网络语言等不规范语言的现象,统计整理出了常见网
学位
NAND闪存是一种被广泛应用于存储领域的非易失性存储介质。随着闪存单位尺寸的减小和每单元存储的数据位增多,闪存存储密度越来越高,这不可避免地带来了闪存可靠性和寿命的降低。为了保证闪存可靠性,提出采用前期主动预防和后期高效修正相结合的方法,从数据写入闪存前的错误预防和数据读出时的错误纠正两个方面入手研究降低闪存误码率。  编程干扰和保留错误被公认为是NAND闪存中最主要的两种错误类型,且与闪存状态密
学位
为了应对日益增长的图处理需求,大量基于整体同步并行计算(Bulk Synchronous Parallel, BSP)模型的图处理系统被提出。近年来,分布式外存模式图处理系统因兼具分布式内存模式与单机外存模式图处理系统的优点而受到了越来越多的关注。然而现有的分布式外存模式图处理系统更注重于提升处理规模,在处理性能方面虽然较单机外存模式有所提升,但依然远不如分布式内存模式图处理系统。  结合BSP计
作为知识图谱补全的重要技术手段,知识推理已经成为当下研究的热点。其中基于路径的知识表示学习模型由于同时考虑了关系路径和实体的语义信息,大大提高了知识推理的准确度。虽然该模型以知识表示学习为基础,通过引入复杂关系路径建模提高了知识推理准确度,但同时也增加了时间开销,难以适应规模日益庞大的知识图谱。  针对复杂关系路径建模存在的效率问题,提出了一种利用子关系路径特征进行建模的方法(Sub-relati
随着大数据和云计算技术的发展,越来越多的数据和服务都部署在数据中心中,这就使得数据中心存储系统的容量变大和异构性突出,导致存储系统的软硬件故障发生的概率变高,进而导致存储系统可靠性和可用性严重降低,增加运行维护成本。硬盘故障预测作为一种主动容错的技术,以其故障前瞻性提高存储系统的可靠性和可用性,越来越受到工业界和学术界的关注。但是,磁盘故障预测还是面临着许多问题,例如数据集的不平衡性、检出率和误报
NANDFlash具有高性能、低延迟、低功耗等优势,因此被广泛应用于数据密集型存储系统。日志结构文件系统(Log-structured File System,LFS)对Flash特性友好,其通过异地更新,将随机写转化为顺序写,具有更高的随机写性能和更低的一致性维护开销。然而,LFS在运行过程中仍然存在段清理开销过大、文件系统写放大严重等问题,导致LFS的性能和Flash设备的寿命大幅降低。  I
大数据时代,闪存凭借优越的性能逐渐取代磁盘成为主流的存储设备。在闪存存储系统中,闪存文件系统的日志结构写方式和闪存转换层的地址映射功能,使数据块和空闲块离散地分布在文件系统和闪存中,带来了严重的碎片化问题。碎片的管理分为碎片避免和碎片整理,现有的碎片避免方案主要面向磁盘文件系统,不适合闪存文件系统;而碎片整理引入了大量的写开销,严重缩短了闪存的寿命。  针对闪存文件系统的逻辑层碎片问题,提出了一种
学位
基于阻变存储器(Resistive Random Access Memory,RRAM)的交叉开关(Crossbar)阵列结构支持高能效存内计算(Processing-In-Memory,PIM),是实现神经形态计算系统最具潜力的架构之一。然而,RRAM器件其单元本身及RRAM单元构成的阵列具有一些非理想因素,这些非理想因素会影响计算的操作数进而使系统的计算准确率降低。选用单元稳定性更高的数字RR
传统动态随机存储器(Dynamic Random Access Memory,DRAM)面临存储密度难以进一步提升、刷新功耗高等问题。而新兴持久内存(Persistent Memory,PM)的读写性能与DRAM接近,同时还具有低功耗、非易失等特性。这使得PM正在成为DRAM内存的一种补充。在PM的几种访问模式中,直接访问(Direct Access, DAX)模式支持应用利用PM的非易失性,且避