MapReduce资源调配关键技术研究

来源 :清华大学 | 被引量 : 0次 | 上传用户：xw511023

【摘要】

：

大数据时代的到来,向如何存储、管理、访问和处理这些巨量数据提出了新的挑战,目前人们普遍认同,并行化处理是在大数据时代中高效处理这些数据密集型应用的有效手段。Map Red

【作者】

：

王博

【出处】

：

清华大学

【发表日期】

：

2015年期

【关键词】

：

Map Reduce 异构集群倾斜数据众核集群马尔科夫链

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

大数据时代的到来,向如何存储、管理、访问和处理这些巨量数据提出了新的挑战,目前人们普遍认同,并行化处理是在大数据时代中高效处理这些数据密集型应用的有效手段。Map Reduce的出现由于其高可扩展性及易于编程性,引起了工业界和学术界的广泛关注,并且产生了大量的优化研究工作。在众多研究工作的优化下,Map Reduce日趋完善,但是随着技术发展,新硬件平台新集群模式的出现,也向Map Reduce性能提出了新的挑战,比如异构集群的出现,众核集群的普及,高性能科学计算领域引入Map Reduce等场景,都使得之前在传统环境下性能良好的Map Reduce框架出现性能低下的问题。针对这些新出现的问题,本文重点针对Map Reduce在异构集群、倾斜数据和众核集群三种应用场景下的性能进行了优化,主要贡献及创新点如下:1)提出了Act Cap,一种根据节点计算能力进行数据分布以优化Map Reduce在日益增长的异构集群上运行时间的方法,其核心部分是使用马尔科夫链模型来实时预测节点的计算能力并且根据节点的计算能力对Map Reduce任务的输入数据进行分布。实验结果表明,Act Cap获得了相对于Hadoop49.8%的平均加速比,相对于Tarazu9.8%的平均加速比—目前最新的在异构集群上的Map Reduce优化工作。2)提出了Skew--,一种称之为“基于复杂度Key分布”的离线数据划分方法,并且使用三个称之为“本地感知Reducer选择”、“全Mapper执行”和“Shu ffl e感知调控”的组件进行智能调度。“基于复杂度Key分布”不仅考虑key记录的大小也考虑Reduce函数的复杂度,以更好地在各个Reduce子任务间平衡计算开销。“本地感知Reducer选择”、“全Mapper执行”和“Shu ffl e感知调控”分别利用数据本地性来减少数据传输,更加有效利用资源来减少离线Key分配带来的额外开销。实验结果表明,Skew--可以取得相对于Hadoop YARN1.98x倍的平均加速比,相对于Skew Tune1.65x倍的平均加速比,并且在Reduce阶段可以取得相对于Top Cluster1.25x倍的平均加速比。3)提出了mp Cache,一个基于SSD的面向Map Reduce的统一缓存系统,该系统缓存输入数据及本地数据来加速Map Reduce中所有IO开销大的阶段—“读入”、“溢出”和“合并”。为了更加高效地利用所有缓存空间,mp Cache动态地调整整个空间在输入缓存和本地缓存之间的配比,mp Cache对所有的节点进行统一管理并且使用针对Map Reduce任务“All-or-Nothing”特性的缓存替换策略来更加良好支持Map Reduce。实验结果表明,mp Cache可以得到相对于Hadoop2.09x倍的平均加速比,相对于PACMan1.79x倍的平均加速比。

其他文献

真菌性食管炎临床和内镜表现与治疗

目的探讨真菌性食管炎临床和内镜表现特点及其治疗。方法回顾性分析我院2006年1月至2011年1月间238例确诊为真菌性食管炎患者的临床资料,其中门诊患者166例,住院患者72例。结

期刊

真菌性食管炎临床特征内镜表现治疗

涡轮复合内燃机两级涡轮流动机理及控制研究

通过涡轮复合回收利用发动机余热是内燃机节能减排的主要技术途径和研究发展方向,也是当代发动机流体力学研究的主要学科前沿问题。涡轮复合技术是使发动机排气在增压涡轮后

学位

内燃机余热利用涡轮复合耦合流动对转涡轮

辽宁省农村金融发展问题研究

随着我国改革开放的不断深入,辽宁省农村金融市场实现了一定的发展,已经拥有比较完善的金融体系,拥有商业性、政策性以及合作性金融结构,其关键在于农村信用合作社,同时还形

学位

农村金融金融市场辽宁省

《寻乌调查》的当代价值

1930年5月，红四军攻克寻乌县城，毛泽东利用红军在安远、寻乌、平远分兵发动群众的机会，在中共寻乌县委书记古柏协助下，在寻乌开展了20多天的社会调查，对寻乌的政治区划、地理交通

报纸

音乐心理学教学纲要与研究型学习资源

本文建构了音乐心理学的教学内容和过程纲要,系统整理和提供了音乐心理学的研究和学习的文献和资源。

期刊

音乐心理学纲要学习与研究资源

电脑大王王安的悲剧

<正> 美国王安电脑以发明计算机起家。以王安命名的公司是全球首屈一指的公司,其年营

期刊

文字处理破产保护

家族企业的管理哲学——以王安电脑公司的破产为例

本文从王安电脑公司内部管理入手,分析出家族企业内部管理在组织机制上、人力资源和重大决策等方面上的弊端,从而提出了对家族企业合理发展的建议。

期刊

家族企业王安公司内部控制

实验音乐心理学百年历史与发展前景鸟瞰

实验音乐心理学百年历史与发展前景鸟瞰刘沛编译１８９７年，美国依阿华大学从耶鲁大学引进一位３１岁的博士———被后人称为“音乐心理学之父”的卡尔·爱弥尔·西肖尔（ＣａｒｌＥｍｉｌＳｅａｓｈｏｒｅ）。在西肖尔领导下，该

期刊

音乐心理学音乐治疗学历史与发展

王安电脑:家族企业的悲剧

<正> 在整个电脑发展史上,只有四位华人产生过巨大的推动作用,其中第一位也是最有影响的就是王安。他所领导的王安电脑实验室的产品曾经风靡一时,行销世界。到1980年,王安公

期刊

家族企业

四妙散加减治疗急性糜烂性胃炎临床观察

目的观察四妙散加减治疗急性糜烂性胃炎的疗效。方法将患者随机分为两组。治疗组予以四妙散加味治疗,对照组予以西药吗丁啉片、阿莫西林胶囊、麦滋林-S颗粒及三九胃泰颗粒口

期刊

急性糜烂性胃炎四妙散

MapReduce资源调配关键技术研究

其他学术论文