高可用HDFS管理平台的设计与实现

被引量 : 0次 | 上传用户:majiguo1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据量的飞速增长,数据密集型应用越来越多,分布式文件系统受到越来越广泛的应用。但是目前以HDFS为代表的主流分布式文件系都是采用元数据和文件数据分离管理的模式,即将命名空间和文件元数据保存在单独的元数据节点(如HDFS中的Namenode)。因此元数据节点的可用性决定着整个分布式文件系统的可用性。本文元数据节点的高可用性问题进行了全面深入的研究,包括分布式文件系统中元数据管理模式以及各自的优缺点;分析提高分布式文件系统中元数据服务器的关键技术,即采用冗余备份的方式;并且介绍了目前常见的用于构建高可用性系统的DRBD技术和Pacemaker技术。针对对高可用HDFS文件系统的需求分析,我设计并实现了基于DRBD和Pacemaker技术的高可用HDFS管理平台,该解决方案包括以下几个主要功能:(1)采用Active/Cold Standby的Namenode高可用性模式,使得Standby Namenode在Active Namenode在发生失败之后可以快速接管工作。(2)利用DRBD来实现Active Namenode和Standby Namenode之间元数据的共享和备份功能;并且利用Pacemaker的集群服务管理功能,实现对Namenode的状态检测和自动切换功能。(3)提供了Hadoop系统管理平台。通过该管理平台,用户可以快速部署高可用性HDFS文件系统,而且可以实时监控HDFS文件系统状态,并且通过管理平台执行常见的管理操作。通过对该高可用性系统进行的测试实验,结合SecondaryNamenod勺检查点功能,该高可用性系统能够在分钟级别完成故障恢复工作,而且只是轻微影响Namenode元数据操作性能以及HDFS文件系统读写性能。
其他文献
本文运用框架理论,以《纽约时报》在2013年对中国的雾霾报道为研究对象,分析美国主流媒体《纽约时报》如何对我国雾霾天气进行报道、有何特点以及不足之处。希望通过研究西方
近些年来,随着我国一些地方省级卫视对于自身资源禀赋及市场定位认识地不断加深,已经有越来越多的地方级电视媒体开始谋求通过发展综艺节目来扩大收视份额。同时,过去一直是
【导读】甘肃省静宁县是全国著名的红富士苹果生产基地,苹果产业是当地农业经济的主导产业,为农民增收、农村发展及农业增效发挥了决定性作用。2012年静宁县委、县政府作出创建
<正> 进入新世纪,企业成功之路将是向用户提供质量高、价格合理且能按时交货的产品。在国际商品激烈竞争的今天,产品质量尤为重要。因为在当今社会,产品质量直接关系到一个企
本文依次讨论了政务微博的公信力问题、公共突发事件中信息的公开程度问题以及政务微博在应对公共突发事件时提升公信力的对策。首先,本文对我国政务微博的发展历程进行了梳
随着市场经济的不断发展和繁荣,法治社会建设的不断加快和完善,党风廉政建设的不断深入推进,地方税务局作为行政执法部门,队伍建设面临着许多新情况、新考验。特别是纳税人依法保
结合广东省及其有关地市时空信息云平台项目的建设情况,探讨了时空信息云平台的主要建设内容和总体构架,提出其技术实现思路,并重点分析了基于超融合基础架构的云运行环境搭
国际贸易创新是指国际贸易的各个领域及其整个过程发生的实质性变革。它具有复杂性、地域性和阶段性的特点。国际贸易创新的内容广泛 ,既包括贸易理论与政策、贸易体制与格局
本文通过分析BT项目的会计处理,提出此模式项目会计核算的思路以及加强财务管理的措施。
<正> 一、主要指标1.道数和道宽 道数N和道宽△U表示输入信号按幅度分类的精细程度。分类的电压间隔大小称为道宽。间隔的最大数目称为道数。道宽实际上是相邻两道的道位置电