基于负载均衡的Hadoop平台下作业调度算法研究

被引量 : 0次 | 上传用户:lianxf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的不断发展,各个企业的IT系统中存储着越来越多与企业运营息息相关的数据,可以说这些数据是企业发展的核心。所有IT系统的发展都依赖于数据。各行各业每天都会产生海量的数据,并且数据量的增长成爆炸式。2010年底,据互联网数据中心的统计,全球数据量已经达到了120万PB,到2020年底,全球所有以电子形式存储的数据量将达到35ZB。人们不禁感叹,大数据时代已经到来。而Hadoop正是应大数据时代的到来而出现的。Hadoop是一个能够对海量数据进行分布式处理的软件框架。它是以一种可靠、高效、可伸缩的方式进行处理的。调度器(Scheduler)是Hadoop平台中一个非常重要的组件,它的主要功能是将系统中的空闲资源按照一定的策略分配给各个作业,它对于整个系统计算资源分配及作业执行起着至关重要的作用。因此我们对Hadoop作业调度器及算法的研究有着重要意义。本文首先介绍了Hadoop平台的优势及体系结构,接着对Hadoop的核心技术即Hadoop的分布式文件系统HDFS和Hadoop分布式数据处理MapReduce做了较为详细的介绍。然后对Hadoop原有的调度算法及LATE调度算法的原理及优缺点做了分析。另外,针对LATE调度算法在为落后任务选择备份执行节点策略的不足,本文提出了改进的LATE调度算法。该算法通过对Hadoop集群中的工作负荷进行分类,并提出对节点工作负载进行衡量的方法,进而在LATE调度算法的基础上提出了新的为落后任务选择备份执行节点的策略。最后介绍了拥有6个节点的Hadoop集群环境的搭建过程,并在该Hadoop集群上对LATE调度算法和改进的LATE调度算法进行了对比实验。实验结果表明,改进的LATE调度算法具有一定的优势。
其他文献
目的分析下腰椎内固定术后早期突发腰部急性痉挛性疼痛的特点及原因,探讨合理的预防及治疗方法。方法对下腰椎内固定术后出现的4例早期腰部急性痉挛性疼痛病例进行分析。结果
<正>2001年6月颁布的《基础教育课程改革纲要(试行)》要求增设综合实践活动课程,它是综合课程与活动课程相结合的产物,一方面,它继承了传统综合课程强调课程目标和内容组织的
受基础设施建设、机械和汽车制造业等下游产业客户的影响,以及房地产成交量随着政府调控政策出台的逐步萎缩,整个钢铁行业出现需求危机,在这样的背景环境下,钢铁生产厂如何通过制
在明朝的建立和巩固过程中,军队立下了汗马功劳。明朝统治者为了维护自己的统治利益,防止汉唐那样的割据势力局面的出现,采取了一系列的相关措施,加强了对军队的监管和控制。明朝
目的探讨椎间盘退变程度与椎间盘源性腰痛手术疗效的关系,为椎间盘源性腰痛的诊断和治疗提供理论依据。方法回顾性分析96例经椎间孔椎间融合联合椎弓根螺钉固定术治疗、来门
合唱中音量的协调统一是提高合唱水平和音乐表现的重要手段。本文根据多年的合唱教学与实践,从五个方面阐述了如何达到合唱音量的协调统一。
在世界市场形成和经济全球化进程快速发展的大背景下,作为全球通用性最强的语言--英语,在各国教育中的地位持续提升。尤其是职业英语,作为社会生活和国家间交流的重要手段,其地位
<正>作为一名教学副校长和教育局兼职教研员,笔者参加过不少观课与评课;作为一名中青年教师,也上过不少公开课、参赛课与研讨课。在评他人与被他人评的不断转换中,笔者对评课
教师资格证统一考试制度是我国教师教育体制改革的突破。但由于我国教师教育机构存在的资源配置差异、民族地区差异和学科差异将会影响我国的师资数量、质量,并进一步加剧城
随着现代信息技术在审计工作中的应用日益广泛和深入,国家审计的组织方式和内容方法在不断变化和创新。本文从信息化对国家审计的影响入手,总结了信息化条件下国家审计的发展