论文部分内容阅读
随着科学计算、协同设计等新型数据密集型应用不断出现,对高性能计算环境的需求不断增加。分布式计算可以把问题分成许多小部分并分配给多个计算资源进行处理,计算资源之间通过数据传输把计算结果综合起来,这需要高速网络互连计算资源。由于光网络具有大容量、低延时、动态控制以及任意粒度带宽等特性,把光网络与分布式计算系统结合,为数据密集型应用提供很好的应用环境。本文主要研究在基于光网络的分布式计算系统中,基于多个调度目标的面向多用户应用请求调度算法以及面向多用户应用请求调度算法中容错保护策略问题。基于光网络的分布式计算系统就是将分布在不同物理位置的计算资源通过光网络连接起来,为各种数据密集型应用提供计算。为了更合理的处理随机到达系统的多个用户应用请求,需要调度算法把用户应用请求中的任务映射到系统资源上,并且在系统存在光链路故障时提供容错保护。基于总的完成时间和执行公平性调度目标,提出三种面向多用户应用请求的调度算法。多用户应用请求直接合成算法对用户应用请求的可执行任务按照底度大小顺序统一调度;多用户应用请求延时加权算法按照到达系统先后时间来改变底度,达到执行公平性和动态调度顺序的目的;多用户应用请求插入算法利用系统处理中的空闲时间来处理后面到达系统的用户应用请求。通过Java开发的仿真工具进行的仿真实验,三种调度算法都在总的完成时间最短与执行公平性最高之间权衡,需要根据实际情况灵活选择。为拥有最后完成期限的多用户应用请求调度问题提出多用户应用请求最后完成期限调度算法,在尽量减少对其他用户应用请求影响的前提下,尽快处理用户应用请求。通过仿真实验的结果可见,提出的调度算法能够更好的满足用户应用请求的最后完成期限。本文最后对面向多用户应用请求调度算法的容错保护策略进行研究。我们提出了两种容错保护策略,面向多用户应用请求的调度算法在调度过程中按照不同的策略计算保护路径,对系统光链路故障进行容错保护。仿真实验的结果证明了容错保护策略能够为存在故障的系统提供更好的容错保护,产生更好的调度结果。