论文部分内容阅读
工作流技术作为一种抽象手段,曾被广泛应用于流水线生产、自动化办公、科学研究等领域。随着云计算的兴起,如何在云环境下调度工作流任务成为了工作流管理系统的新课题。“资源即服务”、“pay per use”等概念的提出,让计算资源能够像水、电一样被有偿使用。工作流调度的研究也从基于时间的调度策略,向基于Quality-of-Service(QoS)约束的调度策略转变。混合云作为新型云环境具有广泛的实用价值,混合云资源调度也成为近年来的研究热点,具有十分重要的研究意义。现有的工作流调度算法主要基于网格或单云环境实现,在混合云环境中的工作流调度需要考虑如任务在混合云上的分配,公有云资源选取等多种因素。现有的混合云调度算法也存在求解速度慢等缺点。针对以上问题,本文分析混合云工作流调度场景,给出了基于数据敏感性、截止时间以及调度费用三种约束下的混合云工作流调度模型,并利用整数线性规划思想对调度问题建模,求解在满足截止时间要求和数据敏感性约束的前提下优化调度成本的调度策略。为加快求解速度,本文基于“帕雷托最优”理论实现任务分配方案筛选,减少了任务与计算资源间的映射关系,减小了计算规模。本文的主要研究工作与贡献如下:1.本文通过分析现阶段在云资源调度方面的研究成果,从工作流调度入手研究基于性能与成本的云资源调度策略。为给出混合云工作流调度模型,本文在现有的基于最大努力交付与基于QoS的两种调度策略的基础上,结合混合云环境的结构以及商业模式,给出了混合云下基于敏感性约束、截止时间与调度费用的工作流调度模型,为后续研究混合云下的工作流调度算法提供研究基础。2.针对用户对云平台计算能力需求的不同,本文研究了混合云环境下工作流调度方法。利用PCH(Path Cluster Heuristic)算法评判私有云计算能力,从而确定工作流任务能否收敛到私有云内部调度。在私有云内部,利用PCP算法实现工作流调度。在同时使用公有云与私有云资源的情况下,将工作流调度问题抽象为整数规划(Integer Linear Program,ILP)问题,建模求解调度策略。3.为优化ILP模型求解速度,本文利用“帕雷托最优”原理,在资源分配之前,对任务在混合云上分配方案进行筛选,排除不可能成为最优解的分配方案,减少了任务与计算资源间的映射关系,减小了计算规模。在ILP模型求解过程中判断每种分配方案能否满足截止时间要求,并选取调度费用最优的调度方案。4.模拟实验与分析。模拟实验比较了不同工作流规模下ILP模型的求解时间以及调度结果,实验表明本文的优化方法能够缩短模型求解时间,在不同规模下都能得到较优的实验结果且误差较小。