文件同步服务中数据同步传输消重策略研究

被引量 : 0次 | 上传用户:jxpyq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前全球化的互联网社会带给人们丰富信息的同时,也给带来了管理海量数据的困难。为了高效简介地管理这些海量数据,云存储技术应运而生并蓬勃发展。由于使用广泛和众多厂商跟进,文件同步服务作为个人级别的云存储服务,成为了广大用户信息化时代管理个人数据的一种有效手段,也已成为学术界和工业界研究开发的热点。重复数据删除技术以其能够利用特定应用数据集内数据高度冗余的特性,高效增加存储空间利用率,降低网络带宽消耗,降低企业IT运营成本等特点,成为了优化云存储系统的关键技术之一;而差量同步算法因其检测网络两端数据间的高度重复而避免传输冗余,提高网络带宽利用率,降低同步操作延迟,同样成为优化云存储系统网络传输的热门技术。本文在构建了结构完整、界面清晰,具有高效同步功能的文件同步服务软件基础上,着重研究了重复数据删除技术与差量同步算法。本文工作量和创新点主有以下几个方面:1.参考流行文件同步服务构建模式,与小组一起设计并开发了EaSync文件同步服务软件,并主要完成Client端的设计与同步传输协议的制定。2.提出了S-Rsync差量同步算法,该算法避免了经典的Rsync算法同步前需要请求服务端文件的分块信息步骤,减少了网络带宽,降低了服务器负载,并提出了一种自适应的差量同步策略。3.分析、比较了现有的重复数据删除技术和系统,确定了基于应用感知的源端重复数据删除系统是EaSync客户端可以采用的有效重复数据删除技术。4.提出了DS-dedupe重复数据删除策略,该策略同时结合源端重复数据删除与差量同步传输技术,优化客户端存储空间利用率的同时,进一步将降低网络带宽的消耗,并给出了该策略的详细设计过程和原型系统实现策略。5.实现了S-Rsync算法与DS-dedupe重复数据删除系统,比较了Rsync,S-dedupe在内的多种数据消重策略,并进行了实验测试。实验结果表明,S-Rsync与DS-dedupe技术在EaSync文件同步服务中能够有效的优化存储空间利用率,降低网络带宽消耗和服务器相应延迟。
其他文献
本文试图从医疗保障改革视角,深入分析我国社会保险和商业保险之间所存在的竞争与合作关系,并以此作为判断两者在整个社会保障体系中地位孰轻孰重的参考标准。最后本文通过实
文章运用言语行为理论,分析了中国外交部发言人答记者问中模糊语言的言内行为、言外行为和言后行为的翻译,总结出四种翻译方法:直译、省译、意译和补译,以助于读者对中国外交
自中国电视诞生,纪录片就活跃在大众的视野里。在不同时期由于内外部多重因素的作用,我国的纪录片表现出政治化、人文化、平民化和社会化的倾向。今天的纪录片创作更加重视影响
古建筑是中华民族文化历史遗产的瑰宝,是一个城市的标志和品牌,而火灾则是目前古建筑保护遇到的第一大问题。作者针对古建筑消防安全特点和古建筑发生火灾的原因,以辽阳古建
我国现行分税制已经实施12年了,总的说来是比较成功的。但它毕竟是在我国建立市场经济初期推出的,目前,从市场经济体制和建立公共财政体系的要求来看,它仍然存在许多不足之处
现代居住小区的标准是生态环境和山水景观优美、功能质量优良、文化上乘、物质精神可持续发展,因此景观设计越来越受重视,本文探讨各种景观设计的控制要素。
聚丙烯酸(PAA)具有很强的亲水性,每一个结构单元上都连着一个羧基基团,在水中电离出氢离子及羧基阴离子。由于高分子阴离子之间的相互排斥作用,聚丙烯酸分子链在水中伸展成松
无线电射频识别(RFID,Radio Frequency Identification)是一种利用无线电信号及空间耦合的自动识别技术。该项技术凭借智能化程度高、快速、实时、非接触等优点,取得了21世纪重要
上海作为全国最早施行基本养老保险制度的城市,在保障退休人员生活水平方面作出了卓有成效的努力。但是,本文通过理论分析与实证研究发现,退休人员的生活质量与满意度不仅取
边坡稳定性研究是岩土工程学科研究的重要问题,但由于影响边坡稳定的因素比较复杂,在边坡稳定性研究中要考虑的因素众多,水既是一个重要影响因素,也是一个难点课题。近年来,随着有