基于HPP全局同步规约网的集合通信研究与实现

来源 :中国科学院研究生院中国科学院大学 | 被引量 : 0次 | 上传用户：kfk

【摘要】

：

并行应用对计算能力的需求永无止境,推动着超级计算机在不断提高单个计算单元性能的同时不断增大系统规模。系统规模的急剧增长,造成消息通信带来的开销日益增加。以全局归约

【作者】

：

黄扬

【机构】

：

中国科学院大学

【出处】

：

中国科学院研究生院中国科学院大学

【发表日期】

：

2012年期

【关键词】

：

体系结构超并行处理全局同步规约网集合通信

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

并行应用对计算能力的需求永无止境,推动着超级计算机在不断提高单个计算单元性能的同时不断增大系统规模。系统规模的急剧增长,造成消息通信带来的开销日益增加。以全局归约为代表的集合通信,己成为制约系统性能的瓶颈。　　超并行处理(Hyper Parallel Processing,简称HPP)体系结构是中国科学院计算技术研究所提出的一种新型体系结构。为了解决集合通信的性能问题,超并行体系结构HPP中引入了全局同步规约网,对集合通信实现硬件加速。本文针对HPP体系结构特点,研究基于HPP全局同步规约网的MPI集合通信。本文的主要工作和贡献有:　　 1)提出了适应多级并行体系结构的可动态调整通信路径的集合通信框架。该框架能在多级并行体系结构下正确有序的完成集合通信;针对多核结构和HPP体系结构的并行层次多,通信机制多样的特点,该框架还可以自适应调整通信层次和通信机制,以选择最优的通信路径完成集合通信,使得MPI集合通信库在不同体系结构上都能获得最优的性能。　　 2)设计了一种硬件资源动态发现和管理技术,使得MPI库成为一个全用户级通信库,在透明使用HPP全局同步规约网的同时,还能支持多个通信域(Communicator)和动态创建通信域。该技术包含两个部分:a)进程物理位置识别和网络拓扑感知技术相结合的多级并行结构下的动态路由发现算法;b)硬件资源的分布式管理技术。硬件资源动态发现和管理技术在充分挖掘硬件并行性的同时,最小化了通信关键路径上的开销,能支持多达16个通信域同时进行MPI_Barrier和MPI_Allreduce,且软件开销不超过整个通信开销的2%。　　 3)提出了面向HPP全局同步规约网的集合通信等价转换算法。HPP全局同步规约网硬件原生支持的集合通信类型只有Barrier和Allreduce操作,本文利用集合通信的等价转换算法,将硬件不直接支持的Allgather、Bcast等集合通信类型也利用硬件加速,使得MPI_Allgather、MPI_Gather、MPI-Bcast和MPI_Scatter获得了与MPI_Allreduce相同的高性能和近似常数的扩展性。　　 4)在曙光6000超龙分区上实现了基于HPP全局同步规约网的集合通信库,并进行了评测。使用IMB(Intel MPI Benchmark)的评测结果表明,集合通信获得了近似常数的扩展性。MPI_Barrier在16个HPP节点规模开销小于3微秒,MPI_Allreduce在16个HPP节点规模开销为8.3微秒,且两者的软件开销都不超过整个通信开销的2%。

其他文献

基于SOA的燃气管网地理信息系统的研究与设计

随着城市化进程的迅速加快,燃气管网规模的进一步扩大。建立燃气管网地理信息系统,加强燃气管网信息化管理,对于保障城市和谐发展,人民安居乐业具有十分重要的现实意义。而燃

学位

SOA框架地理信息系统GIS服务燃气管网WCF技术

多跳无线网络数据传输控制机制研究

当前,无线网络发展的一个重要趋势是从单跳无线网络发展为Mesh和Ad Hoc等大规模多跳无线网络。相比于单跳无线网络,多跳无线网络的网络拓扑和无线链路间的数据传输冲突关系远

学位

多跳无线网络网络拓扑无线链路数据传输

实时交互式虚拟人动作合成的若干高效算法的研究

虚拟人动作合成是利用计算机技术模拟人运动的过程,在多媒体领域有着广泛重要的应用,如影视特效、动漫、视频游戏以及虚拟现实等。目前,虚拟人动作合成主要有三类方法:交互式

学位

实时交互式虚拟人动作合成算法惩罚函数工作原理质量控制

卫星移动通信网络安全认证技术研究

卫星移动通信网络作为卫星移动通信业务的基础支撑系统，综合利用了现代通信技术、计算机技术、航天技术和半导体集成电路技术，是当前通信领域发展非常迅速的方向之一。它具有许

学位

卫星移动通信安全认证密钥管理入网认证端到端认证

陕西电信FTTx网络资源管理系统设计与实现

随着经济和社会的发展，网络已经成为我们生活中必不可少的一部分，我们的生活、学习和工作中都有网络。互联网应经成为全世界最大的网络，而网络的连接是通过各种媒介完成的，从原始

学位

电信网络资源管理系统GIS技术业务需求FTTx技术接入方式

基于不均衡数据挖掘算法的区域化探异常识别研究

随着对区域化探异常识别研究的深入，研究者提出了许多有效的区域化探异常识别方法。近些年来，随着该领域相关计算机技术的进一步深入研究，新的数据挖掘分类方法逐渐被引入到区域

学位

区域化探异常识别机器学习数据挖掘分类方法不均衡问题分形理论分布估计算法

协作虚拟环境下面向复杂场景的可视化交互技术

可视化技术日趋成熟,已在虚拟现实和三维交互设计等许多重要应用中体现出来,特别是实时仿真的应用领域。虚拟现实是可视化技术应用的一个重要体现,在网络技术的发展推动下产

学位

虚拟现实技术协作虚拟环境复杂场景可视化交互技术智能终端

海量RFID数据处理技术的研究与应用

随着传感技术、互联网、通信技术的高速发展，物联网的概念被提出来并且逐渐深入到人类的日常生活中。物联网的使用遍及各行各业，特别是在物流管理中已经得到很成熟的使用。之外

学位

无线射频识别技术数据处理清洗处理模型DCA方法关联度

半导体分选机控制系统上位机的设计与实现

半导体分选机是集成电路半导体元器件在基板封装后切割成单个芯片，并对其进行剥离及外观分选的自动化设备。目前，国内尚无生产半导体分选设备的厂家，而且从国外引进价格昂贵、维

学位

半导体分选机控制系统上位机结构设计

多核处理器及相变存储器的可靠性设计

片上多核处理器以其效能高、设计周期短等优势成为高性能处理器设计的主流架构。相变存储器以其集成度高、漏电功耗低等优势受到多核处理器系统结构设计和研究的广泛关注。另

学位

多核处理器相变存储器可靠性设计软错误工艺偏差老化故障

基于HPP全局同步规约网的集合通信研究与实现

与本文相关的学术论文