论文部分内容阅读
随着互联网技术与云计算业务的迅速发展,数据中心业务量与数据量的爆炸性增长引发了其规模的不断扩增。如今数据中心网络需要承载上万甚至十万台服务器,服务器的端口速率也由1Gbps提升至了40Gbps,这都为数据中心网络带来了新的挑战。为解决传统的网络负载均衡技术中存在的均衡粒度较粗、均衡策略单调、信息感知缺乏等问题,研究人员结合OpenFlow协议、流切片负载均衡等技术提出了全新的负载均衡方案,改善了数据中心网络的性能,但仍存在拓展性不足、与高速传输协议兼容性差等问题。因此,本文提出了基于交换机拥塞信息感知的流切片负载均衡方案和面向RoCEv2协议的流切片负载均衡以及乱序优化方案。针对现有方案拓展性不足的问题,本文面向树形网络拓扑设计了一种基于链路拥塞信息感知的流切片负载均衡方案。该方案将交换机的输出端口缓存队列状态量化得到链路拥塞因子,该因子值超过预定门限后,向边缘交换机发送自定义的SQCN分组。传统方案中边缘交换机需要记录由该节点出发到其他边缘交换机所有路径的拥塞信息,其开销约为k~4。该方案设计了一种多层链表结构,其只记录链路的拥塞状态,使存储开销降低至k~3,大幅增加方案拓展性。从理论分析与网络仿真结果可以看出,该方案在网络吞吐、鼠流完成时间、象流完成时间方面分别比ECMP方案提升20%、降低60%、降低80%,提升幅度大于同类方案CONGA,并且在存储开销方面比CONGA的降低了80%以上。现有负载均衡方案在基于RoCEv2协议的数据中心网络中存在处理乱序代价高的问题,本文为RoCEv2协议设计了基于端到端的流切片负载均衡方案,降低乱序处理的开销以及对网络性能的影响。该方案在拥塞控制协议DCQCN的基础上设计了针对流切片乱序的接收机制,当接收端接收到乱序的分组时不再直接丢弃,而是将乱序分组存储至新的数据段,避免了数据重传所带来的性能损失。若流切片没有发生乱序,则不直接将数据提交至协议栈,而扩大当前数据段用于接收后续的流切片,从而降低了协议栈的处理开销。RDMA应用会产生大量数据量较小的并发请求,该方案将数据量较小的数据请求聚合为一个流切片,数据量较大的流按照固定长度划分为多个流切片,使得网络中的流切片长度相近,提升网络负载均衡效果。从网络仿真结果可以看出,该方案在流完成时间和网络平均吞吐方面与分组级别的负载均衡十分接近,远好于流级别的负载均衡,在协议栈处理开销方面比同类方案Presto降低了90%。