【摘 要】
:
随着大数据技术的发展,生产生活所产生的数据量呈爆炸式增长,无论是个人还是企业,数据存储的成本越发高昂。如何提供有效可靠的数据存储备份服务是一研究热点。重复数据删除是一种用于消除冗余数据、提供可靠存储的技术,广泛应用于大型存储系统之中,但也仍存在一些不足:(1)当前基于内容分块算法存在块大小方差过大和吞吐量过低的问题;(2)基于Map Reduce的重复数据删除系统需要大量写磁盘操作,计算迭代效率较
论文部分内容阅读
随着大数据技术的发展,生产生活所产生的数据量呈爆炸式增长,无论是个人还是企业,数据存储的成本越发高昂。如何提供有效可靠的数据存储备份服务是一研究热点。重复数据删除是一种用于消除冗余数据、提供可靠存储的技术,广泛应用于大型存储系统之中,但也仍存在一些不足:(1)当前基于内容分块算法存在块大小方差过大和吞吐量过低的问题;(2)基于Map Reduce的重复数据删除系统需要大量写磁盘操作,计算迭代效率较低;(3)现阶段基于HDFS的分布式重复数据删除系统并没有考虑HDFS分块与基于内容分块大小不相匹配的问题,导致出现了过多HDFS小文件;(4)采用本地指纹库的分布式重复数据删除系统难以检测节点之间的重复数据,导致系统重复数据删除率较低。针对以上问题,本文提出了快速双极值(Rapid Double Extreme,RDE)分块算法和S-Dedupe重复数据删除系统。首先,针对分块算法块大小方差过大的问题,RDE采用双极值的判断策略,旨在提升算法对低熵字符串的处理能力。然后,针对分块算法吞吐量过低的问题,RDE使用多字节的滑动窗口以控制窗口滑动速度和极值计算粒度。其次,针对基于Map Reduce大量写磁盘操作的问题,S-Dedupe使用Spark框架对重删流程进行并行化和流水线化,目的在于提高计算效率和吞吐量。接着,针对基于HDFS的重复数据删除系统存在过多HDFS小文件问题,S-Dedupe通过块聚合策略减少小文件的产生。最后,针对本地指纹库导致系统重复数据删除率较低的问题,S-Dedupe使用HBase构建分布式指纹库,旨在缓解本地指纹库在分布式环境下对重复数据删除率的影响。实验结果表明,RDE在块大小方差方面取得了显著的提升,在块吞吐量方面也表现优秀。S-Dedupe在吞吐量上相较于常规重复数据删除系统提升达2.26倍,并且在系统重复数据删除率和控制HDFS小文件数量方面也表现出色。
其他文献
<正>核心素养的研究非常重要,随着国家对核心素养的重视,如何将核心素养落实在初中教学中也是一个需要研究的问题。初中语文教师要从课堂入手,培养学生的核心素养。近年来,我国教育部强调核心素养发展的观念。核心素养指的是学生在学校接受教育的过程中慢慢培养出有利于终身成长所需具备的品格和能力。在初中语文教学中不断培养拥有内涵的高素质人才是当务之急,初中语文核心素养的培养要以人为本,强调基础能力的培养。本文主
经济全球化推动着资源、资本、生产要素等的全球化,同时也推动着外籍人口的跨国流动,我国北京、上海、广州、成都等地国际化大都市的地位也越发明显。在广州的外籍人跨国流动中,非洲籍群体尤为居多,他们随着经济资本的全球流动在广州聚居,从事跨国就业和国际商贸,在推动广州国际经济贸易的同时,来穗非洲人面临着生活、住房、教育、商贸等经济上的适应问题,这些经济适应问题随着全球化进程的加快不断凸显。本研究基于普特南的
自新课程改革实施以来,传统的初中语文教学模式逐渐显露出越来越多问题,十分不利于学生核心素养的有效培养,阻碍了初中语文教学工作的进步和创新。基于核心素养下的初中语文教学模式,顺应新课改要求,将语文核心素养内涵融入教学活动中,从引入生活源泉、创新教学方法、构建翻转课堂、深入家校合作等方面,多措并举提升语文课堂的核心素养教育水平,充分体现初中语文课程教学意义。
为了确保幼儿教学效率及教学质量的稳步提升,在幼儿园课程游戏化的背景下,教师应当在游戏活动中加强自身与幼儿之间的互动与交流,使师生之间能够形成一种更为和谐的关系,充分激发幼儿对学习的热情。基于此,文章首先对幼儿园课程游戏化的基本概念加以叙述,再对目前幼儿教师实施课程游戏化中存在的问题展开深入分析,最后提出幼儿园课程游戏化背景下培养良好师幼关系的具体措施。
目的随着人口老龄化加剧,我国骨质疏松症(osteoporosis,OP)的发病率连年攀升。当下急需一种方便有效且有利于大面积开展的预防措施。逆针灸作为中医治未病的典范,有简、便、效、廉的特点,具有适应国家预防OP战略的潜质。近年以来对于OP的逆灸研究有不错的成果,但对于穴位的研究不够深入,这给临床应用带来了不便。本研究以骨密度、骨小梁结构与激素水平为切入点,旨在探讨逆灸不同腧穴对去卵巢诱导的OP模
<正>5月10日,中国建筑集团受邀在上海和北京分别参加2021年中国自主品牌博览会和中国智造品牌论坛暨中央企业高端装备制造创新成就展,其所属子企业中建三局自主研发的"空中造楼机"同步亮相两大活动,受到观展的国内外人士广泛关注。"空中造楼机"全称为"超高层建筑智能化施工装备集成平台",在全球首次将大型塔机和安全防护、临时消防、临时堆场等施工设备、设施直接集成于施工平台上,共用支点,同步顶升,犹如一个
<正>根据已报道的T7核酸内切酶Ⅰ序列设计引物,利用PCR合成与DpnⅠ点突变较正的方法,获得全长450bp的T7核酸内切酶Ⅰ基因。将该基因克隆到pBAD载体上,转化E.coli XL10-GOLD菌株,以L-阿拉伯糖为诱导物,分别在添加与不添加诱导物的氨苄青霉素
落地式空中造楼机是一种用于高层住宅现浇钢筋混凝土施工的成套机械装备。钢结构平台作为空中造楼机的主要承载部件,在建造过程中起到模板挂载、物料转运、混凝土浇筑和施工平台等作用。本文介绍了钢结构平台桁架模块化组合、多功能施工集成、同步升降控制和防坠落保护等关键技术,分析了钢结构平台的安全性、经济性和安装便捷性。研究和示范工程建造表明,落地式空中造楼机钢结构平台能够满足平台同步升降、物料竖向与水平转运、模
<正>产业链标准化:标准化设计,模块化组合,构建产业链标准化库智能信息管控:智能数据采集与监控,实现生产智能化、信息化抗震性能优良:全现浇装配式建造,确保建筑整体抗震性能优良工程质量优良:全程机械操作、智能控制,确保工程质量毫米级建造周期可控:全程智能化、信息化管理,确保建造周期可控性减少垃圾排放:塑料模板自动开合重复利用,减少建筑垃圾产生