云计算下MapReduce编程模型可用性的研究与优化

被引量 : 0次 | 上传用户:liongliong478
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
云计算的根基是那些隐藏于后台的大规模数据,通常数据的规模可以达到TB甚至PB级别,如何处理如此大量的数据是云计算要面临的主要问题之一。由于数据量非常大,单台机器不可能满足海量数据处理的性能和可靠性等方面的要求。因此如何在分布式数据系统中对大规模数据进行处理,是目前云计算所面临的主要挑战。此前的运算模式已经不能满足云计算环境下的数据处理能力,在此背景下,MapReduce编程模型应运而生。然而MapReduce编程模型并不完善,多数学者分别针对该模型算法执行效率、内部算法本身、与现有系统集成或者与现有方法论结合等方面做出了相应贡献。而在MapReduce编程模型总体架构上的改进相对来说较少。本文对Google的云平台技术MapReduce和Google File System进行了深入研究,并针对两个技术在Hadoop中的应用(分别对应MapReduce和Hadoop Distributed File System)进行了深入研究和实践。运用现有框架搭建了一个小型机群,实现了一个用于支持大规模分布式数据处理应用的集群系统,发现了该系统在处理单一节点失效问题上的性能缺陷。提出了使用分层的主从式架构模型以及任务节点元数据备份策略相结合的方式,来解决任务服务器上单一节点失效之后所带来的系统崩溃问题,以此提高了整个系统的可用性同时缓解了任务节点的压力。之后根据本文所做的研究工作,重新搭建了一个改进后的小型应用集群系统,并对改进前与改进后的系统进行了系统的测试和数据收集。通过对数据的汇总、对比及分析,本文得出的结论是,采用本文的架构模型会在系统执行效率方面较传统的主从式架构模型有所下降,但是解决了系统性能瓶颈受限于单一任务服务器的问题,同时大幅提高了系统整体的可用性,因此这种用少量性能换取长时间系统稳定运行的做法是可行的。本文首先对国内外云计算技术研究现状进行了综述,分析了各大公司已有云计算应用的架构与特点;之后,研究与分析了MapReduce编程模型和Google File System等在云计算领域受到广泛关注的技术,并在此基础上进行实验和总结;针对已有应用中出现的单一节点失效问题,提出了使用分层的主从式架构模型与任务节点元数据备份策略相结合的方式对云计算已有架构进行改进,解决了现有系统在任务节点失效之后整体系统瘫痪的问题,同时还降低了任务节点的负荷;最后,对改进前后的集群系统进行了执行效率测试和可用性测试,并对测试数据进行收集、汇总和分析,得出了最终结论。
其他文献
伴随城市建设发展以及人民对生活便利性的需求,传统农贸市场亟需转型升级,通过新建和改造实现标准化、智慧化、品牌化发展。$$做好发展规划。农贸市场是联系农民生产营销和市民
会议
随着工业化进程的推进和经济发展方式的转变,提高企业的全要素生产率成为我国经济持续、稳定增长的关键。已有理论表明,企业规模是影响全要素生产率的一个重要因素。本文在回
"问题学生"一直以来都是小学班级管理中较为棘手的问题,课堂行为不良问题学生作为最常见的类型对班级课堂教学造成了不好的影响。班主任在管理过程中可以采用教育环境改变策
目的在牙列缺损的后牙区植入小直径钛锆种植体,评价小直径钛锆种植体的植入术后的患者疼痛反应。方法用改良牙科焦虑量表筛选出45例非牙科焦虑症患者,患者均为后牙区单牙缺失
钢筋混凝土框架填充墙结构因其设计、施工方便且空间布置灵活因而广泛应用于我国的办公楼、商业建筑及住宅中。在汶川地震中,框架填充墙结构损伤严重,主要震害表现为填充墙产
活塞环是一种具有较大向外扩张变形的金属弹性环,它被装配到剖面与其相应的环形槽内。它与气缸壁的密合程度直接关系着发动机的工作效率和排放状态。由于活塞环气密性指标的
上海经济和社会发展处于重要的转型期,经济发展进入新常态,社区发展面临老龄化等难题,老年志愿者组织在突破社区发展瓶颈发挥越来越重要的作用,取得一定的成绩。随着我国老龄
苏轼是宋代著名文学家,蜀学的代表人物。其思想受儒、道、佛三家影响,是儒、道、佛三家思想圆融的集大成者。后世评价苏轼是以儒家思想入世,以道家思想保身,这固然有一定道理
现行设计方法中,将框架填充墙仅作为非结构构件,不考虑其强度和刚度作用。但在荷载(风力、地震)作用下,填充墙实际上是与框架共同工作的。在填充墙的影响下,框架结构的侧向刚
住房价格关系到人民群众的安居生活和社会的和谐,对住房价格及其测度方法的探讨一直是理论界和实务界关注的热点。由于住房是一种典型的异质性商品,建筑结构、区位、邻里、环