面向热数据的分布式纠删码存储系统研究与实现

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:chen_d031
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的快速发展,世界进入大数据时代,每天都有海量数据的产生,这使得分布式存储系统的存储开销越来越大。分布式存储系统内保证数据高可用的冗余机制使得这种情况更加恶化。目前分布式存储系统内的数据冗余机制主要有两种:一种是多副本,另一种是纠删码。相比于多副本直接将数据备份多份,纠删码利用特定编码规则生成少量冗余数据,极大地减少了存储开销。但是纠删码自身的复杂规则导致分布式存储系统的读、写、更新操作会消耗更多的CPU、网络I/O、硬盘I/O资源,从而导致相应操作的延迟较大。因此,纠删码目前主要用于冷数据或者温数据的存储来减少存储开销,需要频繁访问、更新的热数据仍然用多副本方式存储,来保证热数据的操作性能。针对纠删码存储系统在热数据存储场景下延迟较大问题,本文设计了一种基于日志结构的存储策略,LSEC(Log-Structured Erasure Coding),从系统架构角度,结合多副本和纠删码各自的优点,在提高系统存储效率的同时,满足客户端对热数据存取的性能需求。本文的主要贡献如下:(1)针对在热数据存储场景下纠删码的写、更新操作高延迟问题,设计了LSEC存储策略,借助于日志结构存储,利用非易失性缓冲暂时存储数据,确保数据的持久化和请求的低响应延迟,通过异步纠删码操作降低系统存储开销。(2)为了降低日志结构带来的频繁的垃圾回收操作对系统性能的影响,提出一种分区垃圾回收方法,根据条带粒度将存储节点划分成多个分区,垃圾回收只在在本地分区内执行,进一步改善系统性能。(3)构建了一个系统原型,实现了提出的相关策略。实验结果表明相比于基于DRAM的纠删码存储系统和基于SSD的多副本存储系统,提出的LSEC策略能够降低写、更新操作延迟约1.7倍至20倍。实验结果也表明分区垃圾回收策略能够有效降低垃圾回收活动对系统性能的影响。
其他文献
“一个昏暗而杂乱无章的储藏室里,许多电器被堆在了一起,包括照相机、摄像机、个人电脑、笔记本、MP3等,统统落满灰尘。而另一个画面宽敞明亮的房间中,一个人手持诺基亚N93享受着
<正>1、概述长期以来,我国海洋测绘的水深测量技术一直相当落后,基本上使用多年未变的传统的手段和方法,改革开放二十年来,坚持依靠科技进步取得了很大成绩,加强科技创新,知
会议
回顾我国校园保卫工作的发展情况。当期,随着高校对社会融入度的增大,校园保卫工作的内容更加复杂和多元化,提高管理水平和服务质量,高校保卫采用物业管理模式将是今后的一个发展
目的 研究血清S-100B蛋白在诊断颅内恶性肿瘤放疗引起放射性脑损伤的临床价值.方法 采用酶联免疫吸附测定法检测56例颅内恶性肿瘤患者放疗前、中、后血清S-100B蛋白水平,利用配伍设计的方差分析比较其差异.同时比较颅内恶性肿瘤患者不同放疗方案、瘤周水肿程度和卡氏评分对血清S-100B蛋白水平的影响.结果 放疗前正常对照与放疗组分别(0.039±0.016)、(0.044±0.012)μg/L(t
HP1家族蛋白(Heterochromatin protein 1 family)存在于各种真核生物中,能与组蛋白H3的第9位赖氨酸上的甲基化位点(H3K9me3)和第27位赖氨酸上的甲基化位点(H3K27me3)位点结合。在四膜虫接合生殖阶段,HP1家族蛋白通过与甲基化组蛋白H3K9me3或H3K27me3结合调控异染色质的形成,参与新大核的生成。目前针对HP1家族的研究主要集中在其蛋白功能的多
12月17日,江西南昌某公司14周年庆典上,十来个女员工两两相对跪着,互相有节奏地抽着对方脸颊,工作人员称“这是培养团队狼性精神”。我们不知道这么做有没有激发员工的狼性精神,只
报纸