云环境下容器化Spark资源调度优化机制研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:HNLYLKT
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着云计算与大数据技术的的飞速发展,容器技术和Spark技术得到了广泛的应用,使得传统的Spark部署方式显得越来越臃肿。容器的轻量级、易隔离、开箱即用的特点使得开发者越来越重视将大数据技术与容器技术相结合的探索工作。因此本文提出了容器化的Spark集群资源调度优化方案,并通过实验验证了优化算法的有效性,本文主要包括以下三个方面内容:1)针对传统容器调度算法和主流容器编排工具调度容器时仅关注单个容器的调度指标,在应对集群容器调度时表现出衡量指标单一、负载不均衡和调度总时间过长等问题。提出了OABC(Optimised Artificial Bee Colony)并行调度算法,综合考虑了集群中各节点之间,以及各工作节点与数据源之间的关联性。同时,针对容器编排工具Kubernetes的调度模块插件化特性,增加集群容器并行调度策略,以集群为调度的基本单元,以此实现缩短集群容器的整体调度时间和提高服务性能的目的。实验结果表明,所提出的算法能够有效的缩短整个集群容器的构建时间,且使得集群的整体负载更加均衡。2)将Spark集群以容器的形式部署,改变了以往直接利用宿主机资源的方式,这将导致Spark集群处理任务的性能有所损失,因此提出了HPS(Hierarchical Priority Scheduler)调度策略,通过分析容器化的特性,以及根据宿主节点的实际处理性能和Spark的数据本地化优先级规则,将活跃的Worker节点进行分层。当调度实际Task时,将根据分层后的Worker节点进行分层优先级调度,最大限度的降低了数据跨宿主机之间的传输消耗。实验结果表明,该算法能够有效缩短任务处理时长,一定程度上提高了容器化Spark集群整体的处理性能。3)针对以上提出的容器化Spark集群资源调度问题,设计并实现了一套完整的面向容器化Spark集群的资源调度系统。系统包含了任务提交模块,集群容器调度模块以及Spark资源监控和任务调度模块。系统测试结果表明,通过多个模块的相互协作,该系统大大提升了容器化Spark应用的便捷性,且能够提供一个高效、稳定的容器化大数据资源调度解决方案。
其他文献
沈阳中铁置业有限公司是中铁置业集团的全资子公司,是一家专业房地产开发企业,主要面向东北地区进行住宅、公寓、商业等多种类型的物业开发。面对房地产市场巨大的发展潜力,
目的:研究农村初中生的人格及其父母教养方式的特点,以及父母教养方式与初中生人格的关系。方法:选取农村初二学生156人作为被试,运用父母教养方式评价量表(EMBU)和艾森克人
随着计算机技术与遥感技术的飞速发展,高分辨率遥感图像以其高精度、高光谱及覆盖范围广等特点成为重要的信息源。然而,面对海量的遥感图像,如何从图像中快速、有效、智能的
党的十八大报告提出政治建设、文化建设、经济建设、生态文明建设、社会建设“五位一体”的总布局,为景德镇陶瓷产业的发展指明了发展方向。景德镇陶瓷产业应在“五位一体”
自从住房改革以来,住房市场跟随经济一起增长迅速,但其发展也出现了一些难题,这些难题关系国家经济和社会安定,国家和许多学者不断探索解决问题,目前还未解决。因此,商品房价
根据作者从事小型水电站设计工作的经验,提出了在高原地区小型水电站的水轮机设计选型工作中应注意的一些问题。同时针对高原地区,如何提高小型水轮机的应用技术水平,选用较
【正】随着网络时代的到来,网络通信、信息安全和信息家电产品将越来越普及,而CPU正是所有这些信息产品中必不可少的部件。CPU的英文全称是
现今来看,随着我国经济的不断发展与进步,我国社会主义市场经济体制也不断完善,传感器技术也得到了很大的进步与发展。本文主要是对光电传感器在自动控制中的应用进行了研究,提出
建盏的价格神话建盏今年创造了一个新的价格神话,一只临宇山人藏南宋建窑“油滴天目”茶碗(图一)在纽约佳士得秋拍中以1170.1万美元(近8000万元人民币)成交。这只建盏口径12.
《致西伯利亚囚徒》是苏教版必修三教材里的一篇课文,它是一首政治抒情诗。我们分析诗歌时不能脱离时代背景以及人的情感等因素,因为它是在特定环境下的政治产物,是反应政治情感