论文部分内容阅读
随着云计算技术的不断成熟和进步,基于云计算环境的数据中心也随之发展,建设具有良好管理功能的云数据中心可以提供高质量、安全、可靠的服务,快速的响应日益增长的客户在线请求。所以,云数据中心已经得到了越来越多工业界和学术界研究人员的关注。在高度信息化的现代社会,云数据中心的规模通常都由成千上万台计算节点(如服务器)及相关的设备(如网络、冷却系统)组成,拥有大量的资源,同时随着需求的增加,数据中心的规模也在剧增。它的存在为人们的生活起到了非常重要的作用,已经变成了如同电厂一般的又一基础设施。虽然数据中心给人们带来了很多好处和便利条件,但是随着规模的扩大现有的数据中心存在很多问题,已经不能满足新的需求。首先,为了满足多样化的应用请求,提高数据中心的性能,新型计算系统(如可重构系统)的应用,将有助于数据中心性能的提高,适应多样化的服务请求,但是该类系统的能耗过高,会致使更大的支出,所以若要将其应用于数据中心,就必须解决该类系统能耗开销大的问题;其次就是数据中心的高能耗问题,这个问题不仅使得数据中心的服务供应商要承担巨大的费用(包括电费之内的其他相关费用支出),而且由于数据中心的排放物含碳量过高还会对环境造成严重污染。尽管绿色数据中心的建设,有利于缓解这一问题,但是绿色能源如太阳能、风能的预测性和可持续性较差,难以持续保证能源的供应。此外,高能耗带来的另外一个问题就是计算节点的可靠性,温度的升高会使得数据中心包括计算节点及相关设备的可靠性下降,在运行过程中造成机器失效损坏,严重的使得存储的数据丢失,致使巨大的经济后果。最后,随着规模的扩大,基于地理分布式数据中心的出现,使得服务范围变广,客户请求多,为了满足这些客户的服务需求,良好的资源管理方法可以使得在完成服务部署后,最大化服务供应商收益,所以设计一种高效的资源管理方法将请求进行合理分配也是目前数据中心亟待解决的问题之一。本文就是在这些问题的研究背景驱动下,分别从数据中心内单个系统、集中式数据中心以及分布式数据中心,展开了对数据中心高能耗和资源管理问题的研究。主要解决的问题是:首先,针对可重构系统在数据中心应用的高能耗问题,提出了一种面向基于多FPGAs组件的可重构系统高效能调度算法;其次,面向绿色供能的数据中心提出了一种基于网络能耗感知的调度算法,该算法主要考虑了数据中心网络通信的能耗损失。接着,在此算法基础上,将温度与计算节点的可靠性相互关联,提出了一种可靠性感知的调度算法,这种算法好处在于既可以使得数据中心最大化的利用太阳能,又可以保证计算节点的可靠性;最后,随着数据中心由集中式逐渐转为分布式,基于地理分布式的数据中心提出一种基于蚁群最优化的资源管理方法将服务请求进行合理分配,最大化了服务供应商收益。具体的本文研究工作主要包括了以下三个方面内容:提出了一种基于蚁群最优化的高效能调度算法,扩展了可重构计算系统的应用。设计基于多FPGAs组件的可重构系统高效能调度算法的主要挑战是:资源受限,重构开销,重构端口数量受限以及作业时限等。这些挑战的存在使得其高效能调度方法设计与传统的多核调度不同,为了解决这些问题,本文首先对问题进行了建模,并通过严格推导证明问题属于NP完全问题;接着提出了一种基于蚁群算法的高效能调度算法(AEE),并根据多FPGAs的特点设计了一种任务放置启发式算法。此外,本文将AEE进行改进用于处理大规模有约束关系的作业集,提出了增强版的eAEE算法。最后,将提出的算法与经典的启发式算法比较,证明了提出算法在性能和复杂度上的优越性。提出了面向绿色云数据中心的网络通信能耗感知的调度算法和可靠性感知的调度算法。首先,由于网络能耗的重要性,基于作业时限、总体能耗预算以及太阳能可用性的约束,本文提出了一种网络能耗感知的调度算法。接着,在此基础上,通过考虑数据中心计算节点的可靠性,还提出了一种可靠性感知的调度算法,保证作业的顺利的完成。最后,分别对两种算法进行了模拟实验,并与经典的算法进行比较,结果表明了提出算法的优越性和有效性。提出了一种基于地理分布的数据中心资源管理方法合理分配服务请求,最大化了服务供应商收益。随着日益增长的用户在线请求数量,为了满足客户的服务,云计算系统从原来的集中式处理转变成基于地理分布的分布式处理。然而,由于各个区域电价上的差异,服务提供商在进行服务部署时的成本是不同的。因此,这就要求设计一种合理的资源管理方法,最大限度的提高供应商收益。现有的算法多是考虑电费作为供应商的主要支出,或者忽略多类型的用户请求。所以,在面临多类型的请求时,原有算法不再适用。本文提出了一种基于蚁群思想的用户满意度感知调度方法AMP。通过引入用户满意度的模型,本文将收益最大化问题归结为一个最优化问题。接着,根据用户满意度和数据中心的容量限制,界定了最小满意度的虚拟数量需求。最后,通过仿真实验,将提出的算法与现有的经典算法比较,结果表明提出的算法AMP,无论是在小规模和大规模的数据集上,性能要优越于比较算法。