基于Eucalyptus云平台的Hadoop集群研究

被引量 : 26次 | 上传用户:forbj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
云计算(Cloud Computing)是当前国内外的研究热点之一,是并行计算、网格计算和分布式计算的发展,已成为一种新型的商业计算模式,很多大公司都投入了这一领域的研究,如Google,IBM,微软等等。云计算通过互联网将超大规模的计算、存储资源整合起来,形成一个虚拟的计算资源池并以服务的形式按需提供给用户,使得人们可以方便地通过网络获取强大的计算能力、存储能力以及基础设施。云计算可以有效解决分析与处理海量数据时面临的问题,并提供了可靠性高、可扩展的数据处理存储中心,在降低了终端设备要求的同时提高了处理数据的能力。因此将消耗大量计算资源的复杂计算如海量数据的处理,通过网络分布到多节点上进行计算的方式成为新的有效的解决方案。开源的分布式计算Hadoop系统已经为云计算的具体实现提供了宝贵的经验。Hadoop是Apache开源组织的一个分布式计算开源框架,已在亚马逊、Facebook、百度、Yahoo等多个大型网站上得到应用。Hadoop框架中最核心的设计是MapReduce和HDFS。MapReduce的思想是“任务的分解与结果的汇总”,即首先将一个任务分解为多个子任务,然后把子任务调度到多个集群节点上执行,最后再将结果加以汇总。HDFS是Hadoop分布式文件系统的缩写,为分布式计算存储提供了底层支持。本文研究了云计算的的相关理论、云计算的特点和优势、云计算的关键技术及开源私有云计算平台Eucalyptus,探索了分布式开源框架Hadoop的运行机制和原理。在此基础上研究MapReduce编程模型及其编程方法和建立在Hadoop上的数据仓库基础构架Hive,进一步提出了基于Hadoop的MapReduce分布式编程模型和基于Hive来处理海量数据级别的日志文件的方法。本文还利用开源私有云计算平台Eucalyptus搭建了实验室的私有云,以及搭建了分布式计算平台Hadoop,并将Hadoop集群整合到Eucalyptus私有云上。本文还深入研究了Hadoop集群的动态伸缩方法,主要包括Hadoop集群节点的动态增加及增加节点后的负载均衡方法,以及从集群中移除节点的研究,并提出了心跳检测策略和负载均衡策略,从而提出了一种基于Eucalyptus云上的Hadoop集群弹性伸缩系统设计方案,可以根据一些策略,如心跳检测和负载均衡策略进行弹性伸缩而无需人工干预,并实现了整个弹性伸缩框架原型系统。本文关于开源软件Eucalyptus、Ganglia和Hadoop三者相结合的研究,形成了一套商业化的云计算产品解决方案和实现方法。
其他文献
相变材料在建筑围护结构中的应用已成为当前研究的热点,采用相变材料可以一定程度的改善房屋围护结构的热性能和室内舒适性。将相变材料添加到墙体中,白天熔化吸收并储存房间
用正交试验法及因素法确定了从粘胶抽丝液中直接回收元明粉的最佳工艺条件,讨论地Na2So4结晶状态的影响,滤地其干燥及产品的影响和醇回收。
在化学实践教学中,有一些重难点问题由于缺乏实验的支持,学生学习起来,感到吃力和困惑。针对教学中几个重难点知识,借助数字化传感器,创设实验,帮助学生学习,增强了教学的实
【正】 多年来,我们虽然一直编写中小学历史教材,但在新的形势下如何完成义务教育初中历史教材编写任务呢?征求广大师生意见,他们对我们期望很高,希望我们编写出一套面目全新
本文研究的是刑事领域中的审判程序公正问题。程序公正是现代法治社会的重要标志和重要保障,已经得到全世界范围内的重视。就程序公正的问题,古今中外的学者进行了很多有益的
黄道婆作为南方“木棉”北上传播的杰出使者,为中国棉纺织业的发展作出了难以磨灭的历史贡献。中国棉纺织布技术转化为生产力,必须经过传播、推广的过程。由于黄道婆革新和传
环境监测作为我国环境保护政策里最为基础的工作,在环保系统中占有举足轻重的地位。本文主要通过对我国环境监测现状和出现的问题进行了分析,归纳总结出了造成这些问题的原因
<正> 引言像热塑性塑料那样,热塑性弹性体(TPE)在高温条件下塑化很容易成型;但又与热塑性塑料不同,TPE在常温下具有与橡胶状弹性体相同的注模特性。已推荐并开发出多种分子结
当今时代,是以网络化和数字化为特征的知识经济时代。随着我国网络技术以及信息技术的快速发展,近年来我国互联网的发展速度非常快。互联网已经成为现在“规模最大、范围最广、
肠外肠内营养在临床的应用越来越普遍,但临床应用过程中存在许多问题,临床药师可以利用自己的优势开展肠外肠内营养工作。本文主要从合理用药的几个方面分别阐述临床药师可以