基于Storm平台的离线任务调度优化方法研究

来源 :新疆大学 | 被引量 : 0次 | 上传用户:superzf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据与人工智能等相关技术的发展,传统的批量数据处理模式无法满足需求。数据量的高速增长驱动了大数据流式计算的发展,在流式计算场景下,具有代表性的流式计算框架有多种。Apache Storm可以很好地满足流式环境的特点,其低延迟、高吞吐、高容错等自身特性极大地拓宽了该平台的使用范围。考虑到Storm平台在任务调度方面仍然存在一定的优化空间,为了规避因默认的轮询调度机制带来的通信开销过大、负载不均衡等风险。针对这一类问题,国内外专家学者提出了许多任务调度优化策略,但其中大部分都是针对拓扑运行阶段的在线调度策略,会对拓扑运行过程产生一定的影响。本文选取大数据流式处理框架Apache Storm为研究对象,提出离线环境下考虑拓扑结构的任务调度优化方法(An Offline Task Scheduling Strategy Based on Topology Structure in Storm,TS~2-Storm)。首先根据拓扑的结构特点,建立拓扑逻辑图、拓扑任务分配图、CPU资源限制模型和通信开销最优模型。其次,提出了组件的度的概念,提出节点承载线程数量约束原则。然后结合Storm集群中节点异构性的特点,在离线环境下,将拓扑的部署分为进程的部署和线程的部署这两个过程。按照每个工作节点的剩余CPU资源的数量,对工作节点进行排序,构建出执行拓扑的使用节点集合,并在这些工作节点上配置可用槽。为消除节点内进程间通信开销,利用轮询调度策略,在这些节点上分配一个进程。在线程部署阶段,计算各个组件的度,在满足节点承载线程数量约束的原则上,将度大的组件中的线程尽可能地调度到同一个节点上,通过改善负载均衡状态,达到降低通信开销的目标。将本文提出的调度优化方法,和默认调度策略、离线调度策略进行对比实验。实验所得结果表明:TS~2-Storm策略相比较于Storm的默认调度策略和离线调度策略,在系统延迟时间方面具有不同程度的优化效果。此外,TS~2-Storm策略在CPU资源占用情况、节点间通信开销、负载均衡和吞吐量等方面,相比于Storm默认调度策略和离线调度策略的结果均有一定程度的改善。
其他文献
<正> 近来的研讨认为档案教育业已转向如何在大学里改进档案课程了。然在,很少有人谈及如何将档案专业教育计划与相关专业相联系。本文原作者:泰勒·瓦尔特斯(Tyler Walters)
连日来,随着新型冠状病毒感染的肺炎疫情消息不断,群众的心理也在变化——有人经历了最初的慌乱、恐惧,逐渐平静,有人从最初的不当回事发展到谈疫色变,有人在得知自己接触患者后,立
报纸
<正>调查一:上高档园比上大学贵。在近一年的走访中,有的家长这样告诉人大代表:"现在供一个孩子上高档幼儿园所花的费用比供个大学生还多",并做了一项对比:现今一所正规的大
<正>"学费一个月9000元",还不包括伙食费。仅这一项,若按月缴,北京赵女士的外甥女一年下来就得花费近11万元。这还是收费较低的双语班,如果是国际班,一个月收费12500元。据调
期刊
牙釉质是人体最坚硬的组织之一,在咀嚼中直接承受外载。因其典型的多级微观组成,宏观上它兼具多项优异性能,且可服务于人类的一生。纳米级的羟基磷灰石(HAP)晶体及包裹HAP晶
<正>非法的语言培训机构招聘不具资质的外教,带来的后果就是外教市场鱼龙混杂,教学质量参差不齐。按规定,外国人在华任教,需要持有"外国专家证"等资质证明;聘请外教的语言培
期刊
针对Storm流式计算平台中默认轮询调度策略存在通信开销大、负载不均衡的问题,提出基于拓扑结构的任务调度策略(TS~2)。首先,选取CPU资源充足且可用的工作节点并各分配一个进
社会服务是参政党联系和团结社会的重要渠道,是发挥参政党基本职能的条件和途径。社会服务是参政议政的"资料库"、社会和谐的"助推器"、能力建设的"粘合剂"、人才建设的"蓄水池"。发
中共福建省委印发了《福建省贯彻〈中国共产党统一战线工作条例(试行)〉的实施细则》,并发出通知,要求全省各地各部门结合实际认真遵照执行。《福建省贯彻〈中国共产党统一战线工
报纸