大规模高性能互连网络关键技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：chuanguowuhen

【摘要】

：

E级高性能计算系统的节点规模将达到十万量级，高性能互连网络在性能、扩展性、成本和功耗等方面都面临严峻挑战。在成本和功耗约束条件下，单一追求性能最优的设计方法不再适用，

【作者】

：

苏勇

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2015年期

【关键词】

：

互连网络通信性能低维度路由器交换机节点互连

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

E级高性能计算系统的节点规模将达到十万量级，高性能互连网络在性能、扩展性、成本和功耗等方面都面临严峻挑战。在成本和功耗约束条件下，单一追求性能最优的设计方法不再适用，实现更高的性能功耗比和性能价格比成为互连网络重要的设计目标。针对这一目标，本文围绕增强高性能互连网络的通信性能、可扩展性，降低系统的成本和能耗需求，开展两项研究:1）针对超高端口带宽（如400Gb/s）条件下路由器端口数目受限的问题，本文开展了基于低维度路由器/交换机的直接网络和间接网络结构研究，通过应用通信模式与网络结构的协同设计，最优化网络性能功耗比;2）针对异构计算节点内主处理器成为通信瓶颈的问题，本文开展了节点内互连机制研究，最优化节点内通信效率。　　本文的创新性工作包括:　　(1)根据大多数应用局部通信度小于10的特征，本文提出了以Mesh/Torus直接网络为局域子网，子网间全互连的层次化直接网络结构Hyper2DMesh、Hyper3DMesh和Hyper3DTorus，大幅降低了单路由器端口数目需求，并缩减了全系统网络端口数量。此外，为发挥网络的性能，本文针对上述拓扑的结构特征提出了两类最短路径路由算法。仿真结果显示，在45K节点规模下，相比Torus，Dragonfly和PERCS网络，Hyper3DTorus的局部性应用流量吞吐率可达75％，能耗效率是Dragonfly拓扑的4倍，证明了Hyper3DTorus拓扑具有良好的可扩展性和能耗效率。　　(2)针对大规模系统中，胖树拓扑面临的核心交换机端口数量多和系统成本过高等问题，本文提出了一种融合胖树和全互连拓扑的层次化间接网络结构HyperFatTree，有效降低交换机端口数目。基于拓扑结构特征提出最短路径路由算法，并针对负载不均衡应用提出非最短路径随机路由算法，在降低系统成本功耗的同时，满足不同应用通信特征的性能需求。仿真结果显示在83，232节点规模， HyperFatTree吞吐率为65％，与胖树拓扑5K节点规模的性能相当，系统规模扩大80倍而性能仅下降5％，证明了其平滑扩展能力远胜于胖树。此外，在局部性由弱到强的三种典型应用流量下，HyperFatTree的能耗效率分别达到Dragonfly拓扑的3至7倍以上，证明其达到较高的性能功耗比。　　(3)为实现异构计算节点内多处理器间的高效直接通信，本文提出了一种低开销的网络接口控制器设计:1）基于PCIe扩展的网络通信协议，突破了PCIe原生协议的扩展性限制，降低了I/O与网络协议间的转换开销;2）提供用户级通信接口，并面向MPI编程模型抽象出高效通信原语，实现通信过程全卸载。FPGA原型系统的实验结果显示，节点内最低通信延迟为1.242μ s，有效数据带宽可达3.19 GB/s。

其他文献

访存复杂度与访存部件优化研究

随着计算机技术的发展和进步，应用程序所使用的内存空间越来越大。程序所使用的数据不可避免地要存放在速度较慢的大容量存储设备中，而大容量存储设备的访问速度与处理器的执行

学位

访存复杂度3A2000处理器部件优化稠密矩阵乘法流式访问

基于依存的机器翻译自动评价方法

伴随着机器翻译的不断发展，机器翻译评价技术也在不断发展中。最早出现的机器翻译评价方法是人工评价，人工评价方法的优点是能够得到准确的结果，但是也存在很严重的缺点。比如，采

学位

机器翻译自动评价词汇相似性译文完整性依存分析模型

IEEE802.16e MAC层关键技术研究与协议实现

由于无线通信网络存在物理信道误码率高、时变性强等特性,其媒体接入控制技术(MAC,Medium Access Control)就对无线通信系统的性能起着决定性的作用,因而一直以来MAC技术都是

学位

IEEE802.16e MAC移动切换数据调度协议实现无线通信

基于本体的生物信息网格服务发现与组合研究

生物信息服务具有异构性、分布性、多样性和复杂性，如何有效地利用分布在各地的服务资源、计算资源和数据资源是一个具有现实意义的问题。网格提供了在动态的多机构的虚拟组织

学位

生物信息网格网格服务服务发现服务组合领域本体

无线传感器网络数据融合研究

随着无线通信技术以及电子技术的飞速发展,低成本、低功耗以及多功能的传感器节点应运而生,每个传感器节点具有感知、存储、数据处理以及无线通信的能力.多个传感器节点的集

学位

无线通信无线传感器网络数据融合

面向文本聚类的相似度计算方法研究

作为一种基于无监督学习的知识获取方法，文本聚类是文本挖掘领域的一项重要技术。文本聚类在文档组织、信息检索、话题检测与跟踪等诸多领域都得到了普遍的应用，受到研究者的广

学位

文本相似度多特征集成文本聚类有监督学习语义相似度语言学知识

VNCP：一种虚拟网络综合实验平台的设计与实现

目前，互联网综合实验验证主要基于运行网络实现，周期过长，投入过大，一旦失败代价极为沉重。而且基于运行网络利用测量分析方法进行的实验验证面临诸多难以克服的挑战，如网络行为的

学位

计算机网

软件演化过程的资源管理和过程性能度量与分析

软件演化已成为软件生存周期中最重要的形态之一，对软件演化过程的研究成为了软件演化领域研究的热点。由于软件演化过程具有迭代性、并行性、反馈驱动等特征，因此更有必要对软

学位

软件演化过程过程驱动环境资源管理过程性能度量

无线传感器网络传输QoS保障技术研究

近年来，无线传感器网络由于其巨大的应用潜力成为人们关注的焦点，而其QoS保障技术是无线传感器网络商业化应用的必要条件。本文针对无线传感器网络传输相关的QoS保障技术进行了

学位

无线传感

服务部署系统客户端缓存技术研究与实现

传统以内置磁盘计算机为主体的分散存储模式,虽然在一定程度上满足了人们对系统扩展性和开放性的要求,但在动态性、易用性和管理性等方面存在明显的缺陷.国家高性能计算机工

学位

动态服务部署客户端缓存多级缓存分散存储模式

大规模高性能互连网络关键技术研究

与本文相关的学术论文