论文部分内容阅读
数据中心网络已经成为当前互联网/云计算服务的关键基础设施。不同于传统的有线和无线网络,数据中心网络有一系列独特的特征,包括:多径拓扑,高带宽,低时延,大规模使用低成本商用交换机,独特的多对一/多对多的通信模式、高突发流量、多短流等等。这些特征使得起源于传统网络但又占据数据中心网络内90%以上流量的TCP遇到了很多性能问题,如TCP公平性问题、TCPIncast问题以及TCP Coflow问题。 TCP公平性问题指的是两组不同数量的TCP流进入到同一个交换机的不同输入端口并竞争同一个输出端口时,两组TCP流的平均吞吐量之间存在不公平性。TCP Incast问题指的是在多对一通信模式下,随着并行服务器数量的增加,客户端会出现严重的TCP吞吐量崩溃现象。TCP Coflow问题指的是一组语义相关的TCP流(被称为Coflow)的最终传输完成时间是由这组流中完成时间最慢的TCP流决定的,在未进行任何优化的前提下,Coflow的完成时间较长的问题。 TCP的性能由公平性、吞吐量和时延三个部分刻画。而TCP公平性问题、TCP Incast问题以及TCP Coflow问题表明:数据中心网络中的TCP在这三个重要的指标上都存在着严重的性能不足。研究和优化这三个关键问题,能极大程度地提升TCP在数据中心网络中的性能,进而提高上层互联网/云计算服务的质量。 论文针对这三个关键问题进行了研究,取得了如下研究成果: (1)建立了两组TCP流竞争交换机资源时的TCP公平性模型。本文从理论上分析了数据中心网络中的TCP公平性问题,指出在RTT相等和RTT不等的时候的公平性问题是不同的。本文定量地分析了TCP公平性与TCP丢包、TCP超时、网络参数、流数量、交换机队列管理等因素的关系,进而综合出了RTT相等和RTT不等时的TCP公平性数值模型。该模型能够说明随着网络/流量参数的改变,TCP公平性的变化情况。通过仿真验证了模型的正确性。这是第一个建立数据中心网络TCP公平性模型的工作。 (2)设计了提升TCP公平性的交换机队列调度机制aSFQ。论文根据SFQ和基于数据中心网络的自适应分组策略,设计了基于交换机的队列调度机制aSFQ。仿真证实,当网络环境和流量分布在较大范围内变化时,该机制相比于其他交换机队列管理机制,能提供最优的TCP公平性。 (3)设计了解决TCP Incast问题的应用层调度方案OSDT。论文设计了OSDT来限制并发服务器数量和服务器的发送速率到最优值以充分利用带宽资源而不造成任何丢包。为了实现这个最优调度,论文根据网络参数、Incast场景下的应用参数建立了最优化调度的模型,并根据这个模型计算出OSDT所需的关键参数。仿真和实验结果表明,相比于其他已有的应用层调度方案,该方案在不同的网络/应用参数下都能取得最高的吞吐量。它的平均带宽利用率高达80%以上(而其他方案都不足40%)。该方案能有效地解决TCP Incast问题且性能稳定。 (4)设计了解决TCP Coflow问题的半分布式调度方案CGM-PS。在CGM-PS中,论文提出了inter-Coflow和intra-Coflow两个调度策略。在inter-Coflow调度中,论文使用基于连通图模型的新概念partialCoflow以半分布式的形式近似地实现SEBF这一集中式调度策略。在intra-Coflow调度中,论文提出了FP-MDFS调度算法以分布式的形式给流分配优先级并指派合适的发送速率以让Coflow能够尽快完成传输同时不浪费网络带宽。CGM-PS的调度开销仅仅和分布式方案类似。基于trace的仿真结果表明CGM-PS相比于已有的集中式调度方案和分布式调度方案,都能取得最小的平均和长尾Coflow完成时间(平均而言,相比于集中式方案的完成时间至少减少20%,相比于分布式方案的完成时间至少减少50%)。