高性能树形互连网络关键技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:climb_climb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了满足科学计算和商业应用日益增长的规模需求,计算机系统规模不断扩大。在现今的超算中心或数据中心,高性能互连网络需要互连高达数万甚至数十万个节点。作为计算机系统的传输中枢,互连网络正扮演越来越重要的角色。为了保证系统能不间断地提供高效服务,要求网络高可靠、高通量和低延迟。但是庞大的网络规模和复杂的应用环境,使得实现这些目标越来越困难。  本文以广泛使用的高性能树形互连网络为研究对象,对网络的可靠性保障、高通量传输和低延迟的集合通信技术进行研究,并取得了以下成果。  1)针对以胖树为代表的多根树的结构和路由特性的,提出了一种基于链路失效信息传播的分布式动态容错方法。对于m-Port n-Tree胖树,该容错方法可以在不增加硬件和不增加路由长度的情况下,实现任意m/2-1条链路失效,并依旧维持系统的高性能。  2)为了提高多根树网络的利用率和传输效率,提出一种自适应子流数的多路径传输方法,并实现了一个自适应多路径协议AMTCP。在胖树网络中的评测显示,与传统TCP传输相比,AMTCP可以提高30%以上的网络聚合吞吐率;与多路径传输协议MPTCP相比,AMTCP在性能胜出的同时,在典型负载下可以减少75%的子流数,从而大幅度地降低多路径传输协议的开销。  3)为了实现低延迟的集合通信,提出一种适合树形网络的基于交换机的集合通信加速技术,并设计和实现了一款支持Allreduce和Barrier的集合通信交换机。16节点规模的原型系统显示基于该交换机的集合通信具有优异的性能,短消息MPI Allreduce延迟为4.2μs,比标准软件执行快15倍;MPI Barrier延迟为2.4μs,比标准软件执行快45倍。  4)为了助力互连网络研究,开发了一款全系统互连网络模拟器DCNSim,该模拟器能模拟可配置的计算节点和网络设备,支持丰富的网络拓扑和协议,可以运行无修改的操作系统和应用,并支持分布式模拟。实验评测和应用实例显示,该模拟器具有高准确性和良好的扩展性,并可以被广泛地用于互连网络的研究。
其他文献
近年来,随着计算机和信息技术的迅猛发展和普及应用,行业应用数据呈爆炸性增长,全球进入到了一个全新的“大数据”时代,引起业界、学术界和各国政府的高度关注。大数据中往往
在现代电信管理中,计费系统是电信企业实现与客户的服务关系的纽带,是企业效益的最终体现. 该文主要从以下四个方面介绍了计费系统:(1)从中国电信的发展现状提出"九七工程"的
该论文首先在进程,进程表达式的基础上定义了进程表达式子式,全局满进程,闭包项等概念,通过进程分析有界Petrie网及其特殊子类标识S-图的动态性质.进而按运算符的多少引入一
在大规模数据处理中,文件系统是非常重要的环节之一。文件系统的性能直接影响到应用的性能和处理效率。随着高性能和分布式计算架构的发展,并行文件系统受到了越来越多的关注
学位
近十年来,多核、众核体系结构逐渐成为主流,如何充分利用多核、众核体系结构上丰富的计算资源成为学术界和工业界研究的热点。异步的任务图并行能发掘应用中更多的并行性而受到
传统的软件都是针对某个用户单独定制,无法同时为多个用户提供服务。SaaS是一种具有多租赁性的软件运营模式,在这种模式下同一套软件将可以同时出租给多个租户使用,租户间的数据
搜索引擎的出现使人们获取信息的效率大大提高,怎样从海量的搜索结果中将用户最关心、最需要的信息排在返回列表的最前面,即搜索结果的排序问题是信息检索领域研究的关键问题
该文在软件体系结构的指导下,对MIS进行了三层调查.在系统层抽象中对现有的两层C/S结构和三层C/S结构进行了分析;然后将着重点放到对功能层的抽象上,分析了现有的对功能层的
该课题研究了一种基于几何约束的二维参数化设计的方法,是一种将基于构造过种的方法和变量几何法相结合的机制.通过记录构图过种中几何图素的生成过程的先后顺及连接关系,在