百G以太网可靠传输关键技术研究

来源 :战略支援部队信息工程大学 | 被引量 : 0次 | 上传用户:huaxf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的快速发展以及大数据、云计算、人工智能、物联网等新兴技术的出现,全球数据总量出现爆发式增长,海量的数据被产生、传输、存储和计算。为了满足用户日益增长的网络带宽需求,以太网迎来飞速发展。早在2006年,IEEE802.3ba提出了100G以太网标准,以太网迈入百G超高速时代。从2006年首次提出了100G标准,到2020年第一个800G规范的出现,以太网日新月异的传输速率推动了物联网、自动驾驶、人工智能、数据中心、工业控制等领域的快速发展,但也带来了一系列的问题。在信号高速传输下,信道损坏、信号干扰、链路拥塞产生的恶劣影响被不断放大,严重影响了以太网传输性能。这对数据中心、自动驾驶、物联网、工业控制等网络可靠性要求极高的业务来说是极其不利的,超高速以太网传输可靠性不足成为了这些行业进一步发展必须解决的问题。为降低传输误码率、提升网络可靠性,IEEE以太网标准规定100G及以上超高速以太网必须使用前向纠错(Forward Error Correction,FEC)技术来检测和纠正传输过程中发生的错误。然而,基于FEC的物理层纠错技术存在纠错上限,而且不能处理链路层丢包问题。现有的链路层协议设计主要集中在流控与错误检测,未充分考虑超高速率以太网传输下,由上层协议重传导致的高资源开销、高CPU占用率、高延迟、低带宽利用率的问题。鉴于此,本文对100G以上超高速以太网传输可靠性技术进行研究,详细探究了误码率、链路层丢包等问题的本质,深入分析超高速以太网不可靠传输的原因,然后对现有的FEC技术进行改进,设计了一种面向百G以太网的双模RS解码器,降低FEC解码器内部资源开销与功耗;接着提出一种基于标识确认与应答的链路重传控制(Identification Confirmation and Reply-Link Layer Retransmission Control,ICR-LLRC)机制,将丢包检测与重传处理配置在链路层,实现以太网链路层可靠传输;最后将ICR-LLRC机制应用在数据中心内,解决增强型以太网物理层比特错误问题,降低链路拥塞与比特错误对网络性能的不良影响。本文具体研究内容如下:1、设计了一种能对RS(528,514)和RS(544,514)两种FEC编码方式进行解码的双模RS解码器。针对100G以上超高速以太网在不同传输速率下采用不同的FEC编码方式,每种编码方式对应一种解码实例,导致FEC解码器内多种解码实例独立并存、资源耗费严重的问题,分析了同一伽罗华域下不同类型RS码的解码原理,将多模RS解码器的思想引入超高速以太网FEC解码器,设计了通用的校验子计算(Syndrome Calculate,SC)、关键方程求解(Key Equation Solve,KES)、钱搜索与错误估计(Chien Search and Error Evaluation,CSEE)模块,实现两种解码实例计算资源复用与内存共享。实验结果表明,该双模RS解码器能成功实现对两种FEC规范的解码,解码时延分别为93ns与96ns,相比于传统FEC解码器,资源开销与功耗分别降低了32.32%、17.34%。2、针对当前超高速以太网传输可靠性不足,传统FEC纠错技术无法解决链路层丢包,现有链路层冗余协议设计过度依靠上层协议重传,导致资源开销大、CPU占用率高、重传时延高、带宽利用率低的问题,提出一种基于ICR-LLRC机制的以太网可靠性设计。通过引入链路标识确认与应答(Identify Confirmation and Reply,ICR)机制,实现链路层丢包检测,增加链路层重传控制(Link Layer Retransmission Control,LLRC)机制,实现链路层丢包重传处理,摆脱对上层协议的依赖,减小重传路径,降低时延。实验结果表明,该设计能有效降低重传路径,提升带宽利用率,在重传缓存区大小设置为128*32(位宽*深度)时,降低了54.7%的重传时延,带宽收敛时,有效带宽提升了29.1%。3、针对当前数据中心增强型以太网内优先级流控(Priority based Flow Control,PFC)存在死锁、不公平竞争、队头拥塞,显式拥塞通知(Explicit Congestion Notification,ECN)存在响应速度不及时,且无法解决物理层比特错误的问题,在传统数据中心增强型以太网基础上,引入了前文提出的ICR-LLRC机制,提出一种ICR-LLRC增强型以太网。利用链路层丢包检测与重传,解决增强型以太网不能解决的物理层比特错误问题以及依靠上层协议go-back-N重传的问题,进一步提高数据中心以太网传输效率。实验结果表明,在链路拥塞或物理层出现错误的情况下,该设计能有效降低拥塞持续时间,削弱丢包率对RDMA(Remote Direct Memory Access)性能的影响,提升吞吐量,提升幅度与重传缓存区设置大小相关。
其他文献
高性能计算(High Performance Computing,HPC)除了在海洋模拟、气候预测、分子动力学模拟等科学计算领域具有传统优势之外,近年来也逐渐被广泛应用于人工智能、核能模拟、能源勘探、国民经济预测和决策等方面。高性能计算为这些领域带来了更高效、更准确的数据分析和计算能力,已成为当前世界各国争相抢占的科技制高点,是国家综合科技实力的重要标志。高性能计算集群内各个节点通过高速协同工作,
学位
互联网时代,用户从海量的网络服务中选择符合自己需求的服务,无异于大海捞针,而个性化的Web服务推荐技术和方法能够解决这一难题。然而,移动设备的激增导致具有相似或相同功能的服务越来越多,影响了用户体验。因此,用户更感兴趣的是服务的响应时间和可靠性。服务质量(Quality of Service,QoS)是一个衡量Web服务非功能性能的属性,是个性化服务推荐的一个重要标准。但是,现有的基于QoS预测的
学位
随着近年来云计算、人工智能、高性能计算等领域应用增多,数据中心对计算资源的需求水涨船高。除CPU资源外,图形处理器(GPU)资源凭借其高带宽、高主频和优异的并行计算能力等特性成为另一种优质计算资源。由于GPU资源价格普遍较高,使其成为不同计算应用场景中的稀缺性资源,围绕它的调度也成为业内重点研究方向。目前在GPU资源调度上的研究多局限于单一平台,但当前数据中心往往会部署针对不同领域的多种平台,由于
学位
近年来,我国的超算事业迎来了飞速发展,超级计算机已经成为推动科技创新发展的一个重要工具。然而,用户对超算算力的需求迅猛增长,日益涌现的新型计算服务也对计算规模、时延、灵活性等方面提出了严格要求。多超算中心互联出现,能够解决上述问题。多超算中心互联可以整合跨地域超算中心的计算资源和存储资源,能够高效组织跨地域的多个超算为用户提供多样化算力服务,是支撑高质量计算服务的重要途径。但如何在多超算中心互联系
学位
随着网络应用的不断发展,多种新型网络技术相继涌现,极大丰富了用户的用网需求。面向多样化网络应用,不同新型网络协议的适用场景和安全需求各不相同。针对不同网络的差异化安全转发需求,面向特定场景的个性化安全转发机制往往能最大限度的保障数据的机密性和完整性。然而,不同网络协议对安全转发的需求差异较大,传统加密机制无法适用所有新型网络协议,如何实现灵活、可定义的安全转发技术成为当前研究热点。可编程数据平面以
学位
随着物联网、车联网等技术的出现和应用,以内容为中心的命名数据网络(Named Data Networking,NDN)因其具有的网内缓存、高效数据分发等关键技术,已成为新型网络架构领域的研究热点。TCP/IP协议根植于现有的网络设备,使与IP架构通信过程不同的NDN在实际网络环境中部署存在兼容性问题。可编程交换芯片和高级数据平面编程语言的出现,使网络管理员可以自定义网络协议和转发处理逻辑,提高数据
学位
随着未来计算机微处理器朝着众核处理器方向的发展,以及大规模机群的不断出现,基于异构平台的混合并行编程在今后的大规模并行应用中必将成为主流。在多核体系上,传统的并行编程技术并不能高效地适用,针对多核集群的特殊体系结构,研究相应的编程模型和并行编程技术使其具有更高的性能,具有普遍的研究意义。此外,对超算用户而言,不同架构之间的程序移植带来的编程工作量是巨大的,直接影响了工作效率。通过神威·太湖之光超级
学位
随着互联网的不断发展,大数据、人工智能、5G正在兴起并方便着人类生活的各方各面,数据中心作为信息的载体如雨后春笋般发展起来,呈现数量规模同时上升趋势。科技的发展使发热元件单位面积热流密度不断增大,对数据中心的冷却系统带来了巨大的挑战。传统的风冷、水冷散热方式难以满足高热流密度数据中心的散热需求,浸没式相变液冷以其低能耗、高效率、噪音小等优势受到人们的青睐。浸没式相变散热系统主要是将发热元件浸泡在液
学位
随着信息技术的飞速发展,实时控制、沉浸式交互、边缘计算等应用领域提出了低时延、低抖动的确定性传输需求,未来网络中将会衍生出更多毫秒级乃至微秒级时延的业务需求,在这些对数据传输具有高要求的场景的需求驱使下,数据的实时可靠性传输变得极为重要。然而传统以太网采用的尽力而为分组转发机制具有长尾时延效应,难以满足上述时间敏感业务场景中的有界低时延需求。时间敏感网络(Time-Sensitive Networ
学位
随着5G通信和物联网技术的快速发展,终端设备产生的大量关键数据通过网络传输至算力更强的计算终端。由于终端设备受限于紧张的计算资源、有限的存储空间等问题,传统的密码技术部署方案无法很好地部署在终端设备上。RISC-V指令集因为其短小精悍的架构和模块化的的设计理念成为专用领域架构的首选。通过向基于RISC-V架构的通用处理器中添加密码运算单元,使处理器在不失通用性的同时,还获取了较高的密码运算性能。本
学位