论文部分内容阅读
近年来云服务提供商数据中心的电能消耗在全球总电力消耗占比日益增长。一方面,电能的消耗会带来大量的环境污染;另一方面,数据中心电能消耗带来的电费成本占到了云服务提供商总运营成本的30%以上。如何减少数据中心的能耗成为不容忽视的问题。本文采用基于能量感知的多数据中心工作流调度方法最小化电费成本,同时兼顾工作流应用执行时的能耗优化,具有重要的实际意义和应用前景。本文研究基于能量感知的地理分布式数据中心下的工作流调度问题。考虑前驱数据传输时间、本地数据传输时间和不同地区数据中心的电费价格差异,以最小化服务提供商电费成本为优化目标。首先,本文在应用层面和资源层面分析多数据中心下工作流调度问题的特点和性质,针对优化目标和约束条件建立数学模型。其次,根据建立的数学模型,本文提出基于能量感知的地理分布式数据的云工作流调度算法(ECWSD)。ECWSD算法包括五个部分:考虑工作流截止时间、工作流应用总大小和工作流应用紧急程度三种规则的工作流应用排序,基于任务最大深度的子截止时间划分,基于Upward Rank、Downward Rank和Hybrid Rank三种排序方法的任务调度序列创建,考虑DVFS技术的虚拟机资源分配和基于变邻域下降(Variable Neighborhood Descent,VND)的任务调度序列调整。对提交的一批工作流应用,本文首先进行工作流应用排序,然后按排序后的工作流应用调度序列依次为应用中每个任务划分子截止时间并进行任务排序。其次,根据任务调度序列为每个任务分配虚拟机资源。在虚拟机资源搜索算法设计时,本文针对任务松弛时间的利用分别提出两种资源搜索策略:1)通过更新后继任务的实际开始时间利用任务松弛时间;2)基于DVFS技术降低所分配虚拟机资源的执行频率来减少任务松弛时间,同时可以进一步降低虚拟机的能耗,从而降低任务执行时的电费成本。最后,由于工作流应用的电费成本跟任务调度序列紧密相关,本文提出基于VND的任务序列更新方法,采用动态变化的邻域结构生成新的任务序列解,并搜索电费成本更低的虚拟机资源。为了验证所提算法的性能,本文设计参数校正和算法对比两个实验模块。首先使用多因素方差分析技术对算法参数和排序组合进行分析,选取合适的参数组合和排序规则;然后通过大量标准科学工作流实例对本文提出算法与两种相关算法进行对比。实验结果表明,本文所提出算法在不同截止期程度下,算法性能均明显优于两个基准算法。