论文部分内容阅读
近年来,随着互联网服务呈指数级增加,其背后支撑的物理基础设施数据中心也正在蓬勃发展。数据中心服务器通过存储大量数据,协作进行密集计算,向外提供服务。因此,数据中心网络的传输性能成为影响服务质量的关键。数据中心网络在传输模式、业务流量等方面具有独有的特点,包括高带宽低延迟、多对一传输模式普遍存在、长短流混合等。此外,数据中心网络还需要支撑集群计算应用业务。上述独有的特点以及业务需求给数据中心网络传输带来了新的挑战。例如:显式多路径拥塞控制协议(eXplicit MultiPath,XMP)与数据中心传输控制协议(Data Center TCP,DCTCP)共享数据中心网络时会出现新的问题;集群计算应用程序所涉及的一个并行流的集合(Coflow)可能无法在截止时间之前完成传输。本文分别针对由于XMP流和DCTCP流共存所带来的问题和如何满足Coflow在截止时间之前完成传输的问题,提出传输优化的方案:(1)为了满足数据中心网络中高吞吐量和低时延的需求,已有的工作通过采用多路径传输协议XMP和单路径传输协议DCTCP分别传输吞吐量敏感的长流和时延敏感的短流。然而,本文分析发现当XMP流和DCTCP流共存于数据中心网络时,会产生新的问题。在多对一的传输模式下,由于XMP流的侵略性,DCTCP流更容易被标记而减速,使短流的完成时间增加;同时,采用多路径传输协议XMP更容易发生TCP Incast问题,即多个流并发地向瓶颈链路注入流量,容易导致大量数据包从瓶颈缓冲池溢出,进而造成吞吐量塌陷。基于此,本文设计了一个启发式的调度方案。一方面,为了避免XMP流对DCTCP流的负面影响,该方案在交换机中部署具有显式拥塞通知(Explicit Congestion Notification,ECN)的多服务队列,其中两条服务队列通过加权轮询调度分别服务XMP流和DCTCP流。此外,提供额外的一条高优先级的服务队列用来传输一些紧急的流。另一方面,为了降低XMP流的侵略性,该方案根据网络的拥塞程度动态地调整XMP的子流数目。仿真实验结果显示本文设计的方案能够有效地处理Incast问题,并能够进一步减少流的平均完成时间。(2)针对数据中心网络中集群计算应用业务中Coflow不能满足截止时间需求的问题。本文首先深入分析了 Coflow错过截止时间的主要原因,然后提出了一个截止时间权重指标用来度量流是否能在Coflow截止时间之前完成传输,最后启发式地设计了新的传输控制协议。该协议根据网络拥塞程度和截止时间权重来调整拥塞避免阶段的拥塞窗口的变化。仿真实验结果显示本文设计的协议不仅能有效地提高满足Coflow截止时间的比率,而且能降低平均Coflow流完成时间。