一种高效的负载平衡算法研究与设计

来源 :东北大学 | 被引量 : 0次 | 上传用户:lyztracy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分布式并行计算可以提供相对廉价且强大的处理能力,在研究和应用领域都得到了广泛的关注。负载平衡是影响分布式并行计算性能的重要因素之一,负载平衡策略的效率直接关系到分布式并行系统的执行效果。负载平衡作为提高分布式并行计算性能的关键技术,是一个NP问题,因此分布式并行系统只能通过优化得到近似解而不能获得最优的负载平衡。分布式并行系统具有的特点也进一步增加了负载平衡难度:首先,分布式并行计算系统中节点的异构性和任务的异构性增加了负载平衡策略的难度;其次,网络的异构性也对负载平衡策略提出了挑战;再次,分布式并行系统的不断扩展要求负载平衡策略具有良好的可扩展性;最后,负载平衡策略需要适应分布式并行系统的动态性。这使得,目前对负载平衡的研究在任务调度模型、算法复杂程度、信息获取、数据传输代价、调整策略等方面存在一些问题。针对上述问题,本文在现有研究的基础上设计了任务调度模型,并基于此模型提出一种简单高效的负载平衡算法。(1)针对分布式并行环境的特点设计了任务调度模型。首先,抽象出包含处理数据的任务和纯计算任务的任务模型。其次,抽象出接近实际的系统结构;基于历史值的影响设计了考虑工作节点计算能力动态性和异构性的处理机模型;提出标准网络距离的概念,更好地处理网络的动态变化和计算通信开销,并基于此设计了包含局域网和广域网的通信模型。最后,根据设计的模型给出任务组织形式、迁移方式以及本文负载平衡算法要解决的问题。(2)基于设计的任务调度模型提出一种高效的负载平衡算法。算法将负载平衡分为Assignment和Redistribution两个过程,针对两个过程分别提出了简单且准确性较高的任务调度算法(SHAS:Simple and High Accuracy Scheduling Algorithm)和基于性能收益因子的动态负载调整算法(DLAPGF:Dynamic Load Adjustment Algorithm based on Performance Gains Factor)。SHAS结合了按需和周期性的信息收集方式,并采用捎带信息的方式进一步提高信息的准确性,在此基础上充分考虑通信开销和数据传输代价,提出任务最终完成时间较准确的计算方式,最后在提出的任务调度原则的指导下采用Min-Min算法对新任务进行调度。DLAPGF通过分析得出负载平衡目标,然后基于标准网络距离确定伙伴节点,并采用改进的交互信息反馈方式获取伙伴节点的信息,最后根据工作节点的最终完成时间提出性能收益因子的概念,并在此概念的基础上采用任务交换和任务迁移操作实现动态调整策略,降低了数据传输代价。同时SHAS和DLAPGF在一定程度对系统的动态性进行了处理。(3)基于系统完成时间、系统平衡性、数据传输代价和消息开销四个性能指标,分别对SHAS和DLAPGF的实验结果进行对比和分析,表明了提出算法的有效性。同时,验证了参数和系统动态性对算法效率的影响。
其他文献
聚类是数据挖掘领域中重要的技术之一,用于发现数据对象中未知的分类。聚类算法不仅可以作为发现数据库中数据分布的深层次信息的工具,还可以将其作为数据挖掘中的一个预处理
设备驱动程序是实现计算机与外部设备间正常通信的重要保障。本文介绍并且简要分析了PCI总线和USB总线协议;分析了WDM驱动程序的结构、工作原理和特点,介绍了WDM驱动程序设计中
本文以智能温室为研究对象,对智能温室的控制算法进行研究。温室环境系统是一个多变量的大惯性非线性系统,且有交连,时滞等现象。很难对这类系统建立数学模型及用经典控制方
目前,互联网上存在着各种各样的资源,而且信息量仍在快速增长着。在庞大的互联网中搜索自己所需要的信息,已经成为大部分用户经常性的操作。搜索引擎的出现,使用户搜索信息的
查询处理是任何信息管理系统的重要特征和组成部分。语义Web领域的智能查询处理问题已经成为研究热点,其与已有的查询处理工作最大的不同点是:使得基本的RDF数据存储具有重要
随着电信市场竞争的加剧,业务已经成为电信运营商参与市场竞争的关键元素。下一代网络以业务为驱动力,通过开放业务体系架构能够同时支持话音、数据和多媒体等多元化的业务。而
三维图形引擎是计算机硬件和软件开发的最新技术,实时性,交互性以及强大的漫游功能是其主要特点。三维图形引擎目前在很多领域内都有很广泛的应用,如军方的模拟实战系统以及
集数据采集、处理及通信于一体的无线集成传感器网络以其低廉的价格、便利的部署方式正得到越来越广泛的使用,对传感器网络各个方面的研究也成为目前学术界非常活跃的课题。
在大量的数据库应用中,如面向 Web 的数据集成、电子商务、数据仓库、数据库设计等,都需要用到模式信息。而操作模式信息的一个最基本的操作就是匹配,即将两个模式作为输入,产生
随着数据获取方式的多样性,数据挖掘和机器学习使用的数据集规模越来越大。而随着时间的推移,在大规模数据集的基础上,新的数据也在不停的加入进来,同时,数据集中已有的记录