一种分布式文件系统的设计与实现

被引量 : 4次 | 上传用户:tgb567_2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的快速发展,每天都会产生很多结构化和非结构化数据。存储设备作为存放数据的基础设施,是计算机系统的重要组成部分之一,面临成本高、可靠性很低、利用率低、可扩展性低以及维护费用昂贵的困窘。存储系统逐渐从计算机系统中独立出来,以一个单独的模块管理。从早期DEC的FAL到现在的GFS文件系统大致经历了三个阶段:网络文件系统,共享SAN文件系统和面向对象的文件系统。网络文件系统重点实现网络环境下的文件共享和解决客户端与文件服务器的交互问题;共享SAN文件系统重点研究存储系统的可扩展性和面向SAN的共享文件系统;面向对象文件系统重点研究对象存储,并发访问和元数据管理。从系统架构来看主要有C/S体系结构,共享存储SAN架构,基于集群的分布式架构和P2P对称式体系结构。其中基于集群的分布式文件系统是普遍采用的体系结构,该结构由三个组件构成:客户端、元数据服务器和数据服务器。客户端负责发送读写请求,缓存文件元数据和文件数据。元数据服务器负责管理元数据和处理客户端的请求,是整个系统的核心组件。数据服务器负责存放文件数据,保证数据的可用性和完整性。该架构的好处是性能和容量能够同时扩展,系统规模具有很强的伸缩性。本文设计和实现一种基于集中式元数据服务模型和基于集群的分布式文件系统。其中元数据服务主要由三个部分构成:资源管理节点,元数据服务主节点和元数据服务集群。资源管理节点主要负责管理所有的元数据服务节点,通过心跳技术检测元数据服务所有节点的状态。当主节点失效之后,资源管理节点迅速从元数据集群选择一个主节点恢复元数据服务,从而消除了系统的单点故障,提升了元数据服务的高可用性。数据服务器负责存放文件数据,数据以块的形式管理。每个服务器进程负责一个磁盘,对该磁盘上的数据块进行管理。本文通过把小文件合并成文件块,不但降低小文件写入操作的系统开销,而且节约了磁盘空间。数据节点采用廉价的PC,磁盘资源也很宝贵。磁盘负载失衡会造成磁盘的浪费,本文先对磁盘的负载进行分析,然后采用遗传算法对数据服务器集群所有磁盘进行负载均衡,平衡磁盘之间的使用比例。最后对元数据服务的高可用性,小文件写入操作和数据服务器磁盘负载均衡进行性能测试,测试结果跟HDFS文件系统对比达到预期目标。
其他文献
<正>2016年8月28日,兵团党委召开大会宣布,授予魏德友"优秀共产党员"荣誉称号事件7月26日,《现代快报》"无人区·52载守边人"的报道,让九师一六一团职工魏德友守边事迹传遍全
以湖北省农业科学院果树茶叶研究所柑桔园的柑桔全爪螨为虫源,测定了乙螨唑等5种杀螨剂对柑桔全爪螨雌成螨、幼螨和卵的室内毒杀活性。结果表明,乙螨唑对柑桔全爪螨雌成螨、
挫折教育是国际国内公认的一种重要的教育理念和方法。所谓挫折教育是指教育者有意识地利用学生生活中的挫折源,或设置比较艰苦困难的条件,让受教育者在与困难和挫折作斗争中经
目的:探讨高频超声在膝骨关节炎诊断中的临床价值。方法:应用日本产东芝Aplio770A型彩色超声诊断仪对78例(共122个膝)膝骨关节炎患者的膝关节进行超声检查,详细观察患者有无
<正>在高中生物学学习中,适量的习题是不可避免的,因为一方面对学生来说,它是巩固学生学科基础知识的重要途径之一;另一方面对教师来说,它是教师考查诊断学生阶段性学习情况
中医外治对痹证的治疗具有明显的优势,在临床上得到了广泛的应用和较快的发展,特别是近年来由于药源性疾病日益突出,中药薰洗、塌渍、贴敷、针灸、推拿等外治法普遍用于治疗
郦学札记(八)陈桥驿水冶《水经注》记载的古代冶金工业超过十处,其中卷十六《水》经“水出弘农黾池县南林阳谷”注中的水冶,很值得重视。注云:戴延之《西征记》云:次至白超垒,去函谷
目的:探讨腹腔镜再次胆道探查术治疗胆管结石的方法和临床应用价值。方法:回顾分析为31例复发性胆管结石患者施行腹腔镜胆道探查取石术的临床资料。结果:31例中2例因腹腔粘连
目的分析快速康复路径应用于胫腓骨骨折患者中的临床效果。方法收集胫腓骨骨折患者100例,以抽签分组法随机分为治疗组及对照组,各50例。治疗组予以快速康复护理路径,对照组予
人类走向不可持续发展的方向 ,源自于自身的价值观和世界观 ,正是这种以机械论为代表的价值观 ,导致了人与自然的对立。生态哲学作为整体论世界观 ,对世界的本原、主体和客体