论文部分内容阅读
作为云计算和下一代网络技术创新的平台,数据中心在提供网络服务和技术革新的历程中扮演着十分重要的角色。它的高性能通信主要受两类应用的影响:一类是数据中心内部的大块数据传输,比如虚拟机迁移和大规模数据存储同步,它们产生数据量大并且持续时间久的长流;另一类是面向外部用户的小块数据传输,比如基于 Map/Reduce架构的 Web索引和大数据分析,它们产生大量动态性高、数据量小并且持续时间短的短流。相对来讲,长流对传输时延不敏感,但追求高链路利用率和高突发容忍度;而短流追求低延时,延时过大会直接影响用户体验质量,导致企业的商业收益下滑。 由于交换机缓存在混合流之间是共享的,长流为了追求高吞吐量,需要尽可能多地占用交换机缓存,但这会使得后续到来的属于短流的报文排队时延增大,或者丢包引发Incast等问题,导致传输时延过大的问题。因此,为了满足短流的低延时要求,需要维持较小的缓存队列长度;但是,过低的缓存占用量却会导致相连路径的链路利用率下降,无法满足网络中长流的高吞吐量需求。所以,如何平衡长短流对交换机缓存占用量的矛盾需求,满足不同应用的传输要求,成为本文研究的重点。 针对这个问题,本文提出 LBMP算法。首先,基于最小缓存控制模型,采用显式拥塞通知的方法,当瓶颈链路的缓存队列长度超过一定的阈值,对传输分组进行标记并反馈给源端,源端统计每个循环内接收到的被标记分组数衡量相应路径的拥塞程度,根据拥塞程度的不同成比例地减小发送速率,将缓存队列长度维持在一个较低的范围内,减小短流的传输时延;其次,通过多路径传输的方式充分利用数据中心的多条可用路径,将单个MPTCP连接的流量分配到多条路径上进行传输,LBMP能够自适应地减少拥塞程度高的路径上发送的数据量,增加拥塞程度低的路径上发送的数据量,同时,当子流在连续循环内接收到的被标记分组数增大时,判定该路径进入“持续拥塞”状态,将当前子流的拥塞窗口更新为初始值,重新由慢启动阶段探测性地发送数据,避免子流对整个连接的数据传输造成“拖尾”问题,导致传输性能下降,这种拥塞控制方法能够自适应地均衡网络负载,提高长流的吞吐量。 最后,采用 NS3模拟数据中心网络的拓扑结构和流量类型,通过大量仿真实验,发现 LBMP能够在保障短流传输低时延的前提下,充分利用网络中的多条路径,大大地提高长流的吞吐量,维持较高的链路利用率。另外,相比于已有的多路径传输控制算法,当获得的吞吐量相近时,LBMP所需要建立的子流数目更少,能够有效地节约系统开销。