论文部分内容阅读
随着云计算、大数据等应用的广泛部署,数据中心的体系结构、网络规模、工作模式、运行环境和流量状态发生了极大改变,具体包括:计算、存储、网络融合的趋势不断增强;单一数据中心的规模向数万甚至数十万节点扩展;服务器经常通过并行计算、分布式协作完成复杂任务;服务器虚拟化和存储虚拟化技术广泛部署;数据中心内部流量已经达到zetta(1021)字节。上述改变对数据中心系统架构提出了严峻的挑战。尤其在云环境下,网络作为连接所有计算资源和存储资源的桥梁,承担着分布式任务协同、东西向流量传输和虚拟技术支撑等工作,其性能对数据中心整体系统的应用执行效率和工作完成时间有重要影响。为解决传统网络核心层链路拥塞、扩展性不足、灵活性受限、成本较高的问题,研究人员提出了新的网络互连架构,包括:fat tree,VL2,BCube,DCell,FiConn,CamCube等,尽管这些互连方案能够有效改善网络的时延、吞吐性能,但这些收益均以增加互连线路和交换设备为代价,因此上述方案同时带来拓扑结构复杂、线缆开销巨大、设备数量过多、网络能耗难以优化等问题。与电互连技术相比,光互连技术具有高带宽、低时延、低能耗、透明传输等特点,能够满足应用对传输带宽、设备能耗、通信时延和安全性的要求,因此成为研究人员关注的焦点。但由于现有多数光互连网络设计直接移植电信网的交换技术、节点结构和互连方式,因此存在一些缺陷,具体在节点层面,现有的交换节点或存在开关时延较长、信息操作粒度过粗的问题,或存在端口数目受限、元件开销较大的问题。在网络层面,现有的拓扑结构存在扩展规模较小、网络连通性有限的问题。在控制层面,现有设计存在调度算法复杂、控制时延较高的问题。上述问题影响了光网络的性能,使光互连架构只能作为辅助网络部署在核心层,大部分流量仍通过电交换设备处理,数据中心网络的能耗、设备开销和线缆问题未得到真正解决。对此,本论文展开对数据中心高性能光互连网络的研究,通过设计新的互连拓扑、节点结构、通信方法,解决现有方案中的容量问题、阻塞问题、扩展问题和控制时延问题。论文的主要工作及研究成果如下:⑴对数据中心光互连技术的最新研究进展进行了较全面的综述,从网络结构、交换节点、交换机制、基于SDN的光互连技术、其他研究问题等五个方面对现有设计方案进行了整理和归纳。重点对光互连网络架构进行了分析研究,介绍了现有光电混合网络、集中式全光网络和分布式全光网络,从交换技术、扩展性、技术可行性、设备开销等方面对上述经典方案进行了综合对比。总结现有光互连网络的不足,提出结合硅光技术最新进展设计分布式互连架构的改进思路。⑵针对传统光电路交换网络扩展性不足、阻塞率较高、全局流量状态获取困难的问题,论文提出基于同构拓扑的光电混合互连架构,通过使用基于folded-Clos的多级互连结构,将位于核心层的光网络扩展至汇聚层,更多的流量可以通过高带宽、低能耗的光电路传输。该架构设计了分布式控制协议以完成多跳光连接的建立,同时利用多波长技术增强网络的连通性。为充分利用并行的传输路径和波长信道,架构提出了基于反向建链的光电路交换策略。最后的仿真结果表明:在混合流量模式下,该架构与纯电分组网络相比,其饱和点和最大吞吐至少增加了1.96倍。⑶针对快速光电路交换对网络节点度和处理时延的要求,结合电路交换和分组交换的不同特征,提出了基于异构拓扑的光电混合互连架构THOR。通过为该混合网络的光互连和电互连部分设计不同拓扑结构,充分适配两种交换技术的不同特点。通过使用更具扩展性的超立方拓扑,THOR可以为数万台服务器直接提供端到端的光连接,这有效降低的网络的能耗和缓存开销。THOR设计了分布式控制系统以支持快速光电路交换技术,进一步通过将该系统集成到电互连部分缩减了网络成本和线缆。为支持基于多波长和多跳的光电路交换,THOR结合异质光交换单元设计了新的交换节点结构,该节点能够以集约、经济的方式实现波长域和空域的信息交换。基于网络拓扑和交换节点,THOR设计了路径共享的通信策略降低网络阻塞。最后的仿真结果表明:在实际流量下,THOR能够达到无阻塞交换网络90%的容量,同时能够极大改善鼠流和象流的流完成时间。另外,通过提供服务器级的光连接,THOR与fat tree和传统光电混合网络相比分别降低了53%和23%的能耗。⑷针对光分组交换网络中缓存实现成本高、可靠性难以保证的问题,提出了基于多跳的NACK(Negative Acknowledgement)机制。该机制利用光器件双向传输特性和资源保留策略构建了多跳的反馈信道,进一步通过在冲突节点回传NACK分组实现了在无缓存光网络中可靠的信息传输。基于该策略,设计了面向数据中心的大规模全光互连网络PetaScale。结合网络拓扑,PetaScale提出了多波长通信策略以降低网络阻塞并优化光链路利用效率。为支持所提出的无缓存多波长光分组交换,PetaScale设计了新的交换机结构。最后与fat tree和H-LION网络的仿真对比表明,在均匀流量模式下,PetaScale的时延吞吐性能优于H-LION,达到fat tree网络的82.4%。在局部流量模式下,PetaScale的性能同时由于两种对比网络。