基于冗余机制的分布式存储系统性能优化研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:yh__nn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的高速发展,我们已经步入了大数据时代。在与日俱增的数据规模面前,传统的关系型数据库显得无能无力,而分布式计算和分布式存储技术受到广泛关注。分布式存储是分布式计算的存储部分,是易于扩展的、虚拟化的存储资源池。为了满足大规模存储应用的需求,提供可靠的海量数据存储服务,分布式存储系统使用冗余机制来保障数据的高可用性和可靠性。副本和编码是分布式存储系统目前主要的两种冗余机制。副本即对文件进行拷贝,而编码是通过对文件块进行线性或非线性处理生成编码块的冗余技术。由于数据规模异常庞大,采用副本冗余机制导致分布式存储系统需要付出巨大的存储空间开销。虽然编码冗余机制可以降低存储空间开销,但它需要额外的编解码时间对数据进行修复。面对这些高昂而又无法避免的额外开销,我们可以利用不同的冗余机制来优化分布式存储系统其他方面的性能,如通过副本降低分布式系统能耗和利用编码冗余机制减少文件修复时间。本文主要研究了分布式存储系统的副本和编码两种冗余机制。针对使用副本作为冗余机制的分布式文件系统HDFS,我们设计了一种节能策略来降低分布式存储系统的能耗。这部分的工作主要包含两部分:节能的文件备份策略(EFR)和节能的作业调度策略(EJS)。为了让EJS达到降低能耗的目的,EFR使用了一种简单又有效的方式去放置文件的文件块。针对使用编码作为冗余机制的网络异构环境下的分布式存储系统,我们提出了一种能够降低文件修复时间的弹性树形结构再生码算法FTR。为了验证FTR算法的可用性和有效性,我们开发了一个实际的基于再生码的分布式文件存储系统RCDFS,并对RCDFS的设计和实现细节进行了详细的描述。通过实验表明,Hadoop使用EJS和EFR结合的策略可以让系统节约50-60%的能量,另一方面,FTR算法能够有效的在RCDFS上运行及其在网络环境异构性明显的情况下,其数据修复时间低于STAR算法。
其他文献
近年来,绘画CAD系统的发展越来越快,各种系统层出不穷。但其中有针对性研究墨韵效果的绘画CAD系统却并不多见。在本文中,我们主要提出了一个用来产生墨韵效果的绘画CAD的通用算
随着计算机处理能力地提高和宽带网络的普及,网络多媒体应用得到了快速的增长。同时,嵌入式技术的不断发展,以嵌入式机顶盒为终端的网络媒体应用逐渐成为趋势。其中,以嵌入式机顶
计算机技术的迅猛发展,给人们的工作和生活带来了前所未有的便利和效率,网络技术的普及又使其如虎添翼,走进社会生活的各个领域,成为人类社会不可或缺的一部分。然而,计算机病毒的
目前,网络面临的安全威胁主要来自于黑客通过网络对计算机系统的入侵。相对于传统的破坏手段而言,网络入侵没有地域和时间的限制,入侵手段更加隐蔽和复杂。如何对入侵进行检测,已
谈判是多方展开商务合作、进行业务往来过程中一个必不可少且十分重要的环节。自动谈判的研究吸引了来自学术界以及业界等多方面的注意力。自动谈判的机制可以通过利用计算机
无线传感器网络WSN是由大量随机部署在监测区域的微小传感器节点通过自组织方式构成的分布式智能网络系统,一般用于在无人监管的情况下对周围感兴趣的环境变量或者事件对象进
在计算机技术的发展过程中,仿真一直是一个重要的研究领域。在设计一个新的嵌入式系统时,有效地测试和验证新系统的功能和性能是十分重要的。采用软/硬件协同设计的方法能有
三维重构是计算机图形学的重要分支,有着广泛的应用。目前还没有比较通用的技术可以解决所有问题。本文所介绍的系统,致力于满足廉价的家用建模的需求,是一种基于侧面图的静
网络扩展性是移动自组织网络中的一个重要问题,利用分群的方法可以增强网络扩展性,是移动自组网被广泛使用,和实现网络管理、提高传输效率、提供各种应用服务的基础。在本文中,我
随着计算机技术特别是互联网技术的迅猛增长,软件已经成为人们生活、个人以及组织跨越地理边界进行有效地协作的一部分。这些技术的发展和提高需要用软件来满足其不断增加的需