Hadoop云平台综合优化

被引量 : 1次 | 上传用户：luzhengnan801106

【摘要】

：

大数据时代信息量的急剧增长，对信息处理速度也提出了越来越高的需求。作为MapReduce计算模型的开源实现，Hadoop云平台为用户提供了简洁可靠的大数据处理方案。在处理TB和PB级

【作者】

：

许丞

【发表日期】

：

2014年01期

【关键词】

：

Hadoop 负载均衡 JobTracker 负载回归分析

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

大数据时代信息量的急剧增长，对信息处理速度也提出了越来越高的需求。作为MapReduce计算模型的开源实现，Hadoop云平台为用户提供了简洁可靠的大数据处理方案。在处理TB和PB级数据计算中, MapReduce已经成为使用最为广泛的并行编程模型。由于MapReduce计算框架最早是为Google的数据处理业务而设计的，对不同环境、不同类型的大数据处理业务，并没有进行特别优化。因此，改进Hadoop的平台的MapReduce计算框架，对提高Hadoop平台综合性能、优化计算资源分配与利用，有着非常重要的意义。本文针对Hadoop平台的MapReduce计算框架中的负载均衡与任务配置优化机制进行了研究，取得了如下成果：（1）在Hadoop平台中提出了一种新的分区方案。与Hadoop默认的分区方案相比，它具有平衡Reduce Task负载、提高集群资源利用率和加速Job整体运行速度的优势。通过对Reduce Task建立回归分析模型，预测Reduce Task运行时间的差异，据此重新分配Reduce Task之间输入数据的规模，使得Reduce Task之间的总体完成时间趋于一致，避免了因数据分配不均，导致部分Reduce Task执行时间过长的问题；同时，本方案在建立Reduce Task运行时间的过程中，考虑了Node计算资源差异、负载情况对运行时间的影响，使分配的结果更符合实际应用情况。此外，与特定领域的负载均衡方案相比，本方案受到的限制更少，只需Map Task的输出结果的Reduce Task之间不存在固定的映射关系。（2）提出了一种新的资源管理与计算任务监控方案。在该方案中，将JobTracker的集群资源管理与任务监控功能分成两个组件完成。其中，JobTracker的角色变为Monitor Node保留任务监控功能，而资源管理功能分配给新加入的资源管理节点完成。JobTracker和资源管理节点之间通过增量更新算法同步信息。资源管理节点根据配置的调度器，进行任务调度，并将调度结果返回给JobTracker节点。实验结果表明，本方案实现了资源管理节点与JobTracker之间快速信息同步，降低了JobTracker的负担，提高了平台的鲁棒性与工作效率，可以有效扩展Hadoop云平台的工作规模。（3）设计和实现了基于任务完成时间的负载均衡分区方案；对分离式任务调度与监控方案进行了仿真验证。实验表明，本文提出的Hadoop综合优化方案，可以对Hadoop集群的实际运行情况进行分析、预测，并进行分区操作，均衡节点之间的计算任务；对于JobTracker负载过高的问题，本文提出的分离方案可以有效降低JobTracker的负载。

其他文献

河南省普通高校网球运动发展现状及对策研究

网球运动是一项深受人们喜爱、富有乐趣的体育活动,它诞生于12世纪、13世纪的法国,成熟于英国,普及形成高潮在美国。它具有很高的锻炼价值和很强的观赏性,是一项老少皆宜的运

学位

河南省普通高校网球运动现状对策研究

酶在水果加工中的创造性应用——明日的科技

<正> 果汁工业也象其它行业一样,经受各种变化的影响。由于果汁工业与其它行业不同,其原料来源于自然,因此还要受原料的大幅度影响。近几年来,我们目睹了其结果:在欠收的年份

期刊

酶水果加工果汁提取果汁处理果浆处理

浅谈汽车发动机水温高的故障诊断及原因

汽车发动机是汽车的心脏,发动机水温过高会导致工作无力,功率低下,严重时会拉缸、粘缸,甚至曲轴抱死。汽车发动机水温高的故障诊断及故障排除尤为重要。

期刊

发动机水温高故障诊断原因

利率市场化改革对我国商业银行的影响及风险防范

作为金融市场中最基本的变量之一，利率的变化对整个金融市场甚至整个国民经济生活都起着重要的影响作用。随着市场经济的逐步发展，利率管制在金融领域中的优势逐渐消失，利率自由

学位

利率市场化影响应对措施

论我国小额贷款公司的监管问题

我国于2005年开始商业性小额贷款公司的试点工作。自小额贷款公司成立以来,学术界关于其监管问题的争议就从未停止过。之所以对监管问题有争议,往往来自于对小额贷款公司定性

学位

小额贷款公司行政监管金融监管

基于ZigBee的智能大棚控制系统研究

随着嵌入式技术、无线通信技术的发展，无线传感器网络(Wireless Sensor Network：WSN)在智能家居、智能大棚等领域应用越来越广泛。我国在智能大棚方面的研究起步较晚，虽然取得了

学位

智能大棚ZigBee环境因子控制机构

我国的微博问政及规范化研究

在网络越来越普及的现在，微博慢慢渗透到我们生活每一个角落，这也为我国的民主化进程带来了便利，微博问政模式给我们政府提供了更加方便快捷的官民沟通的平台。在微博问政平台上

学位

微博问政微博网络政治参与

生态标签对绿色品牌购买意愿的影响研究

随着消费者环保意识的提高,绿色品牌购买意愿的形成机制已成为学术研究的热门话题。目前,学者们已从消费者和品牌自身出发,探讨了绿色品牌购买意愿的影响因素和作用路径。但

期刊

生态标签绿色品牌信任绿色品牌购买意愿消费者怀疑

英语经济新闻《世界经济专题报道》翻译实践报告

新闻对政治、经济和文化的传播至关重要。随着全球化的发展，我国以更加开放的姿态参与到世界经济文化交流中，而我们需要更多的经济信息以紧跟世界经济发展的步伐，所以经济新闻的

学位

经济新闻新闻翻译翻译方法翻译原则

嵌段含氟聚丙烯酸酯树脂的合成及其在氟碳涂料中的应用研究

氟碳涂料因其具有优异的疏水性、耐久性、耐候性、耐酸碱性和突出的防粘污自清洁功能而备受青睐。氟碳涂料的这些优异性能主要取决于它的成膜树脂即有机氟树脂的超长性能，而嵌

学位

嵌段型含氟聚丙烯酸酯氟碳涂料结构可控原子转移自由基聚合

Hadoop云平台综合优化

其他学术论文