基于SLA感知的Hadoop YARN节能调度策略研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:wscmjk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的不断发展和互联网的迅速普及,人们从信息接收者逐渐转变为信息的生产者,信息的爆炸式增长推动着互联网进入大数据时代。如今大数据已经成为一种重要的战略资源和新型决策方式,而云计算则为大数据分析与处理提供了强大的存储和计算能力。Hadoop是Apache软件基金会旗下的一个开源的分布式计算平台,它可以部署在普通的商业硬件上,具有高容错和低成本的特性。随着大数据和云计算的兴起,越来越多的公司开始利用Hadoop平台来提供云服务。高性能计算集群的日益增加和大规模部署带来了巨大的能源消耗,云服务提供商不仅需要满足用户在服务等级协议(SLA)中提出的需求,还要在保证服务质量的前提下尽可能地降低资源成本。为了克服Hadoop 1.0在可靠性、可扩展性和资源利用率等方面存在的局限性,Hadoop 2.0将其资源管理功能抽象成了一个独立的通用系统YARN。YARN能够同时支持多种计算框架(如MapReduce、Spark、Storm等),并对集群系统中的资源进行统一管理和调度,这种共享集群的模式具有资源利用率高、运维成本低以及数据共享的优点。作为当前最流行的集群资源管理系统,YARN在迎来发展机遇的同时仍然面临着两个严峻的挑战:一是根据每个应用程序的SLA中指定的截止时间自动调整和控制资源分配,二是基于截止时间约束减少整个集群系统的能源消耗。因此,Hadoop YARN在云计算环境下的资源分配和节能调度已经成为目前亟待研究和解决的问题。针对上述问题和挑战,本文提出了一种基于SLA感知的Hadoop YARN节能调度策略。该策略通过对多租户云计算环境下的MapReduce程序进行预测分析来获得各个阶段的性能指标,根据这些性能指标和SLA中指定的截止时间可以确定程序两阶段任务的并行度;然后利用SLA感知资源调度器为每个应用程序动态地分配资源,从而确保任务并行度在运行过程中不会发生变化;最后结合动态电压频率调整(DVFS)技术实现任务调度以达到节能的目的。综上所述,本文提出的节能调度策略能够在多租户云计算环境下合理地分配资源,同时在保证截止时间的前提下最大限度地降低云计算平台的能耗。网络带宽一直是制约云计算发展的瓶颈之一,基于SLA感知的Hadoop YARN节能调度策略充分利用了Hadoop数据本地化的特性来减少网络通信,并利用数据传输产生的松弛时间实现任务节能调度。此外,本文使用了CloudSim云计算仿真平台来评估资源分配算法和节能调度算法的性能。实验结果表明,与现有的YARN资源调度方案相比,本文提出的节能调度策略能够做到对资源的高效利用,并在保证应用程序截止时间的前提下有效地减少资源成本和能源消耗。
其他文献
随着互联网技术飞跃性的发展,Web上的网站数量和网页数量正以指数级的速度快速增长。Web已经成为一个拥有海量数据,数据类型多样,数据结构各异巨大的数据源。Web数据集成系统
云计算自从诞生以来,就备受瞩目,得到了快速地发展。然而,随着云计算规模扩大以及复杂度的提高,遇到的新挑战也是不断出现。负载均衡问题就是其中之一。负载的过重会严重影响
群体动画技术在电影、游戏等多媒体领域有着广泛的应用,因此群体动画生成与编辑技术越来越成为运动编辑方向的研究热点。目前对于大规模多人行为模拟的生成与编辑两部分研究
世界上半数以上的人居住在都市,都市是现代社会的中心。都市人群的生活包括衣食住行、学习、娱乐等多个方面,研究都市人群生活现状,无论对于政府、企业、社会组织,乃至个人,
随着全球化,信息化的迅猛发展,网络带宽的增长和网络安全问题的层出不穷对网络数据包的处理性能提出了新的要求。VPN和防火墙是企业和个人用户实现安全传输网络流量的重要手
本文研究模糊逻辑中蕴涵算子的构造。主要内容如下:   第一章:介绍了模糊逻辑的发展及目前国内外研究的概况,给出了后面章节需要用到的一些定义、定理,并且介绍了[0,1]上几种
随着软件规模的不断扩大,软件测试工作的复杂程度也大大增加,软件测试的成本也在不断上升。如何有效的对软件测试工作进行管理,提高测试效率,变得十分重要。测试管理工具能够
机器翻译是自然语言处理领域的一个重要研究课题,对于目前高速发展的信息社会有着广泛的市场潜力和研究价值。随着科学技术的逐渐发展,基于图像识别的机器翻译开始引起人们的
如何提高网络入侵检测系统的实时性和适应性是网络入侵检测系统中的两大研究课题。为此,一些学者提出通过特征选择建立轻量级入侵检测系统的思想;另一些学者认为网络入侵检测
近年来,随着互联网的发展,一些社会网络,例如,国外的Twitter、Facebook、 Flickr以及国内的新浪微博、知乎等,用户量大且活跃度高,信息在网络中传播范围快而广,使得影响力最