【摘 要】
:
Hadoop是一个分布式计算的解决方案,随着互联网的快速发展,数字新一代开始崛起,人们的消费生活模式也跟随着不断改变,电子商务和社交网络开始成为人们生活中重要的组成部分,
论文部分内容阅读
Hadoop是一个分布式计算的解决方案,随着互联网的快速发展,数字新一代开始崛起,人们的消费生活模式也跟随着不断改变,电子商务和社交网络开始成为人们生活中重要的组成部分,与此同时庞大的数据量也随着领域的发展产生出来。在Hadoop平台上能编写应用,这些应用能运行在分布式系统上,可以用来处理规模比较大的数据。本文深入分析了Hadoop调度算法研究的的近况,对于Hadoop调度算法的一些问题,例如执行效率低下、资源利用率不高和无法适应异构环境进行了研究。首先,对Hadoop算法FIFO和作业分类算法的优缺点进行了详尽的分析,并具体针对单队列资源利用率低下和不能适应异构环境的问题进行了改进。把作业划分成不同队列,然后根据作业的截止时间分配不同的时间片轮流执行不同队列里面的作业,提出了基于多队列和轮转的Hadoop调度算法。该算法提高了集群效率和资源利用率。其次,对Hadoop原生算法Fair和基于任务时间的算法的优缺点进行了详细的分析,并具体针对小作业任务的“饥饿”问题和系统资源利用率低的问题进行了改进。该算法根据以下方法动态的估计作业的剩余执行时间,首先计算集群环境下任务以前的执行率,然后用指数平滑预估作业在下一次执行中的执行率。估计剩余时间后对Map和Reduce阶段二者的差值进行分析,对作业进行不同的排序,提出基于任务时间和指数平滑的调度算法。该算法解决了小作业饥饿及资源效率低的问题。最后,搭建Hadoop运行环境,实现了MQWR算法和TMF算法。并且把这两个算法与Fair调度算法和Task Schedule Deadline调度算法对比,说明本文提出的算法的有效性。
其他文献
输电线路是电力系统运行的重要组成部分,由于其分布范围广,常面临复杂地理环境与气候环境的影响,因此,深入分析输电线路的各类运行故障,采取针对性措施,对于增加电网运行安全
<正><正>我绝对相信,这些不用付工资,还得自己掏腰包,一分钱折扣没有的老顾客,比我付工资的员工,在挑刺、找茬儿方面更用心、更细腻、更不手软。由于最近很多人都在嘲笑"互联
风险投资是促进科技成果转化 ,培育高新技术企业 ,为国民经济增长提供重要源泉的生力军和催化剂。推动风险投资的发展已经成为许多国家促进中小企业技术创新和高新技术产业发
最近,新兴污染物逐渐成为环境研究的焦点。药品和个人护理产品(Pharmaceuticals and personal care products,PPCPs)是新兴污染物最重要的组分之一,由于过量使用和不完全代谢导致大量PPCPs被排放到水环境中。某些PPCPs会对人类、野生生物和水生生态系统构成长期威胁。传统的水处理厂通常无法有效去除PPCPs,并且在世界各地的废水、海水、地表水和饮用水中均检测
社交媒体的快速发展促使传统广告产业业态发生巨变,尤其是形态各异的社交媒体不断涌现,更是激发了以社交媒体为代表的新媒体成为广告行业发展的引擎。美国作为全球新媒体广告的
设计了基于STM32微控制器的激光打标控制系统,对激光打标系统的几何畸变进行了分析,并提出了简化的矫正方法。使用微控制器模拟振镜控制传输协议(XY2-100)控制振镜扫描,同时控
<正> 一、对隐名合伙的历史探源及法律特点分析 一般认为,所谓“隐名合伙”(Dorment Partner-ship),是指当事人一方对另一方的生产、经营出资,不参加实际的经营活动,而分享营
中外汇票背书制度的立法研究●阮赞林背书是指汇票的持票人为转让票据权利于他人为目的的一种票据行为。票据的特点在于其流通,离开了流通性,票据便失去了其作为票据的特点。票
目的:观察小儿推拿治疗婴幼儿腹泻护理的疗效,为临床提供治疗护理参考依据。方法:将64例婴幼儿腹泻患儿都首选小儿推拿法治疗,观察其疗效。结果:治疗有效率100%。结论:小儿推
作为新世纪文学中重要的文学现象,"打工诗歌"至今已经发生很大变化。文章以"打工诗歌"的代表诗人郑小琼为中心,透视"打工诗歌"近年来在存在样态、抒情身份以及艺术水准上的嬗变,试