论文部分内容阅读
随着互联网技术的快速发展以及大数据、云计算、人工智能、物联网等新兴技术的出现,全球数据总量出现爆发式增长,海量的数据被产生、传输、存储和计算。为了满足用户日益增长的网络带宽需求,以太网迎来飞速发展。早在2006年,IEEE802.3ba提出了100G以太网标准,以太网迈入百G超高速时代。从2006年首次提出了100G标准,到2020年第一个800G规范的出现,以太网日新月异的传输速率推动了物联网、自动驾驶、人工智能、数据中心、工业控制等领域的快速发展,但也带来了一系列的问题。在信号高速传输下,信道损坏、信号干扰、链路拥塞产生的恶劣影响被不断放大,严重影响了以太网传输性能。这对数据中心、自动驾驶、物联网、工业控制等网络可靠性要求极高的业务来说是极其不利的,超高速以太网传输可靠性不足成为了这些行业进一步发展必须解决的问题。为降低传输误码率、提升网络可靠性,IEEE以太网标准规定100G及以上超高速以太网必须使用前向纠错(Forward Error Correction,FEC)技术来检测和纠正传输过程中发生的错误。然而,基于FEC的物理层纠错技术存在纠错上限,而且不能处理链路层丢包问题。现有的链路层协议设计主要集中在流控与错误检测,未充分考虑超高速率以太网传输下,由上层协议重传导致的高资源开销、高CPU占用率、高延迟、低带宽利用率的问题。鉴于此,本文对100G以上超高速以太网传输可靠性技术进行研究,详细探究了误码率、链路层丢包等问题的本质,深入分析超高速以太网不可靠传输的原因,然后对现有的FEC技术进行改进,设计了一种面向百G以太网的双模RS解码器,降低FEC解码器内部资源开销与功耗;接着提出一种基于标识确认与应答的链路重传控制(Identification Confirmation and Reply-Link Layer Retransmission Control,ICR-LLRC)机制,将丢包检测与重传处理配置在链路层,实现以太网链路层可靠传输;最后将ICR-LLRC机制应用在数据中心内,解决增强型以太网物理层比特错误问题,降低链路拥塞与比特错误对网络性能的不良影响。本文具体研究内容如下:1、设计了一种能对RS(528,514)和RS(544,514)两种FEC编码方式进行解码的双模RS解码器。针对100G以上超高速以太网在不同传输速率下采用不同的FEC编码方式,每种编码方式对应一种解码实例,导致FEC解码器内多种解码实例独立并存、资源耗费严重的问题,分析了同一伽罗华域下不同类型RS码的解码原理,将多模RS解码器的思想引入超高速以太网FEC解码器,设计了通用的校验子计算(Syndrome Calculate,SC)、关键方程求解(Key Equation Solve,KES)、钱搜索与错误估计(Chien Search and Error Evaluation,CSEE)模块,实现两种解码实例计算资源复用与内存共享。实验结果表明,该双模RS解码器能成功实现对两种FEC规范的解码,解码时延分别为93ns与96ns,相比于传统FEC解码器,资源开销与功耗分别降低了32.32%、17.34%。2、针对当前超高速以太网传输可靠性不足,传统FEC纠错技术无法解决链路层丢包,现有链路层冗余协议设计过度依靠上层协议重传,导致资源开销大、CPU占用率高、重传时延高、带宽利用率低的问题,提出一种基于ICR-LLRC机制的以太网可靠性设计。通过引入链路标识确认与应答(Identify Confirmation and Reply,ICR)机制,实现链路层丢包检测,增加链路层重传控制(Link Layer Retransmission Control,LLRC)机制,实现链路层丢包重传处理,摆脱对上层协议的依赖,减小重传路径,降低时延。实验结果表明,该设计能有效降低重传路径,提升带宽利用率,在重传缓存区大小设置为128*32(位宽*深度)时,降低了54.7%的重传时延,带宽收敛时,有效带宽提升了29.1%。3、针对当前数据中心增强型以太网内优先级流控(Priority based Flow Control,PFC)存在死锁、不公平竞争、队头拥塞,显式拥塞通知(Explicit Congestion Notification,ECN)存在响应速度不及时,且无法解决物理层比特错误的问题,在传统数据中心增强型以太网基础上,引入了前文提出的ICR-LLRC机制,提出一种ICR-LLRC增强型以太网。利用链路层丢包检测与重传,解决增强型以太网不能解决的物理层比特错误问题以及依靠上层协议go-back-N重传的问题,进一步提高数据中心以太网传输效率。实验结果表明,在链路拥塞或物理层出现错误的情况下,该设计能有效降低拥塞持续时间,削弱丢包率对RDMA(Remote Direct Memory Access)性能的影响,提升吞吐量,提升幅度与重传缓存区设置大小相关。