基于RDMA的存储系统低延迟优化技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:yujing4953
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
低延迟高带宽的RDMA(Remote Direct Memory Access)传输网络和NVMe(Non-Volatile Memory Express)SSD(Solid-State Drive)等高性能存储设备的出现,给传统存储系统带来了严峻的挑战。存储系统需要优化其软件栈来适应新设备带来的高性能。RDMA有迥异于TCP的调用接口、更加高效的使用方式,同时也有特殊的缺陷。高性能存储系统的软件栈需要针对RDMA的特殊性进行优化,才能达到理想的I/O延迟。RDMA注册内存的合理使用、RDMA NIC(Network Interface Card)与CPU的交互效率、RDMA处理消息采用的线程模型都会影响采用RDMA的存储系统的I/O延迟。针对分布式NVMe块存储系统中数据I/O延迟在RDMA层面的优化进行研究,讨论了如何实现低延迟的RDMA数据传输。主要从四个方面对RDMA的使用进行优化:1.比较数据I/O过程中的RDMA网络交互模型的不同实现,并通过WRITE_WITH_IMM进一步简化网络交互模型,降低RDMA的网络延迟;2.评估本地内存拷贝的时间开销,并分析I/O路径中普遍存在的内存拷贝开销,通过复用RDMA内存,减少内存拷贝次数;3.使用类SPDK的线程模型,减少线程切换引入的延迟开销。4.部分修改上层应用交互协议,利用imm_data和inline优化RDMA的使用,降低NIC发起的DMA次数。通过对比每个优化措施优化前后的延迟变化,以及将合并的优化方案与Ceph RDMA的实现进行延迟对比,结果表明,选用合适的RDMA READ/WRITE操作可以优化网络交互流程,有效降低网络往返和RDMA软件栈带来的延迟;减少I/O路径上的内存拷贝次数能有效降低大块数据的传输延迟;使用imm_data和inline能够小幅度降低延迟;避免过多的线程切换是RDMA低延迟的保证。相较于Ceph RDMA实现,合并优化方案对16KB以下小块数据传输延迟能够降低34%~54%,对16KB以上大块数据能降低33%以上,且数据量越大,降低延迟越多。
其他文献
刚度属于冲压件的使用性能,是弹性范围内抵抗外力载荷的能力。关于冲压件刚度的影响因素,至今没有明确的结论。本文创造性地以原始钢板为研究对象,利用动力显式有限元仿真软件,分
用单摆测量重力加速度是我们高中生接触到的一个比较简单的物理实验。但其中在实验条件中强调了单摆摆角需要小于5°,这其中的原因是什么呢?本文抓住实验中的这一疑问,通过
开关电源,全称为开关式稳压电源,是上世纪70年代发展起来的,用来替代老式串联型稳压电源的一种新型电源。开关电源具有重量轻、体积小、效率高、能耗低、温度低和电压调整范
<正>从四月初至今,消费保累计接到2704件与QQ相关的投诉案例,仅4月19日投诉量高达197件,投诉问题集中在账号被封、永久冻结等方面。从诞生至今,QQ已经陪伴人们整整20年了,对
有不少学者尝试运用模型化方法研究中医理论,研究角度多从哲学、数学等方面进行,至今尚未形成较为公认的观点和结论。本文首先对国内外模型化方法研究中医基础理论的现状进行总
沿铁路线架设的电力贯通(自闭)线是电气化铁路的重要组成部分。铁路架设环境复杂,地形多变,贯通线多采用架空线与电缆混合方式,由于架空线路的暴露性和电缆线路设备老化问题,在运行期间难免发生故障。一旦出现故障,铁路信号装置将不能正常运行,进而影响铁路的正常运输。因此,当故障发生时,应尽快掌握故障信息,并排除故障。目前,针对铁路贯通线路并没有成熟的故障监测与管理系统。本文在原铁路配电自动化系统的基础上开发
从近年来大学生对课堂教学所反馈的情况来看,平时成绩评定标准的合理性和程序的公正性已成为关注的热点,以至于院长信箱中也收到反映教师平时成绩给定不公的投诉.而另一方面,
分析视网膜血管结构的变化是诊断和检测糖尿病、高血压等血管类相关疾病的最重要步骤。为此,提出了一种基于Frangi滤波器和大津法(Otsu)的视网膜血管分割方法。基于Frangi滤
将森林抚育间伐与森林水化学效应结合起来进行研究,探讨小强度间伐对森林水质的影响。基于固定样地的研究方法,在秦岭火地塘林区选择天然锐齿栎林,设置抚育间伐强度分别为5%
财务管理目标理论是研究在一定社会经济环境下财务管理目标的形成、表现和实现的理论.它包括财务管理目标和实现目标的观念要求两个方面的内容,后者又包括财务管理假设、财务