论文部分内容阅读
随着互联网和计算机的快速发展,云计算国家战略的不断推进,用于承载云计算任务的各类数据中心也日益增多。当前我国数据中心建设和运行过程中面临的一个主要挑战是数据中心能耗的急剧增长。相比国际上先进的数据中心,我国的数据中心普遍能耗巨大,并且资源利用率极低。国际上用PUE(Power Usage Effectiveness,电源使用效率)来衡量一个数据中心的能源使用效率,相比于国外,我国数据中心PUE值偏高,绿色化程度较低。由于数据中心能耗主要来源于IT设备、空调制冷系统、照明系统、供配电系统等,且不同设备具有不同的类型、接口和厂商,导致数据中心能耗数据来源复杂。数据格式和采集方式也不尽相同,给数据中心能耗数据的实时采集和监控带来巨大的挑战。因此,本文从数据中心能耗的实时采集和负载预测方面着手,对能耗数据进行实时采集监控,改善能耗管理。旨在降低数据中心PUE值,提高数据中心总体能效水平。本论文完成的主要工作如下:(1)分析我国数据中心能耗分布特点和各类能耗数据采集原理,阐述国内外现有监控系统运行机制,总结并分析存在的不足之处。(2)研究面向海量测点的高频、细粒度感知数据采集、汇聚与同步机制;定义可扩展的、一致的数据采集接口,屏蔽资源的异构性,达到实现采集多元、异构能耗数据的目的。(3)建立能耗数据实时采集方法、模型,研究不同类型的负载对数据中心能耗的影响;提出了一个基于深度循环神经网络的主机负载多步在线预测框架,实现对主机负载的预测。(4)对能耗数据采集系统进行总体架构设计与实现,并进行部署和验证。本论文设计并实现一套高效能数据中心能耗数据实时采集系统,在能耗数据采集和主机负载预测方面对数据中心的资源消耗进行量化,有效实现数据中心机房能耗数据实时采集,为监控与评估数据中心能耗,实现能耗高效管理提供数据支撑。