论文部分内容阅读
数据中心网络作为数据传输、计算和存储的中心,集中了各种软硬件资源和关键业务系统,诸如Web服务、搜索引擎、网上购物、网络游戏和MapReduce服务等。近年来,数据中心在云计算和虚拟化技术等新兴应用的发展带动下,在组成、结构、功能、规模及应用模式等方面都发生了深刻的变革。数据中心网络的特性与传统广域网差异巨大,部署在数据中心中的应用需求以及数据流量的特性千差万别,这些对数据中心的可用性可靠性提出了新的需求。为提高数据中心网络性能,本文从网络流量负载均衡策略和对网络流量的准确预测两个课题进行了探索性的研究。一方面,对于数据中心内不可预测的流量,基于路由的负载均衡策略可以降低网络时延,提高网络吞吐量。另一方面,数据中心内可预测流量进行准确的预测后,可根据流量预测值来进行网络流量全局优化调度,从而提升网络性能。课题一中,基于Fat-tree网络拓扑在数据中心中的广泛应用,本文对适用于Fat-tree 网络的负载均衡算法进行了研究,进而提出 了一种叫做全局轮询(Global Round Robin,GRR)的路由算法以及该算法的改进版本(ImprovedGlobalRoundRobin,IGRR)。该算法通过在顶层交换机和服务器之间的周期性连接配置,在上行路由中将数据包完全均匀地发送至所有可行路径上,并在下行路由中采用自路由的策略。理论分析和仿真验证发现该算法在不同的数据源模型下都实现了较好的负载均衡性能。于此同时,该算法中交换机内部固定周期性的连接配置也简化交换机结构的复杂性,降低了对交换机内部的硬件要求。课题二对如何进行准确的流量预测展开了研究。期望根据准确的流量预测,提前对可预测的流量制定相应的路由策略,以此提高网络吞吐量。本文将流量预测进行模型抽象为时间序列预测。相比于传统数理统计中的预测方法,本文中采用了基于深度学习的网络流量预测。通过设计一个能较好拟合流量特征的递归神经网络(RecurrentNeural Network,RNN),以此来根据流量历史数据来预测未来一段时间内的流量大小。根据流量特征,该课题中设计了一个5层,且每层100个基本单元的递归神经网络模型,并分别用一个一维特征的数据集和一个三维特征的数据集对模型进行训练。结果表明RNN网络模型相比于其他数理统计方法有更小的均方误差(Mean Square Error,MSE),而使用三维特征数据训练得到的RNN模型的性能比使用一维特征数据训练得到的RNN模型更好。