聚合通信操作的卸载与优化

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:nobita8371
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚合通信广泛应用于高性能计算的研究和工程领域,研究表明其在应用程序的科学计算时间中占据很大比例,某些应用程序的聚合通信时间可以占到整个通信时间70%以上,是高性能计算(HPC)系统的性能瓶颈。基于软件实现聚合通信操作的方法虽然有诸多优点,但已经不能满足日益增长的高性能计算应用的性能需求。而可编程网络硬件的出现,使得在网计算和在网缓存技术成为可能。通过将在网计算与缓存技术应用于异构并行智能计算的互连网络,互连网络就能够在数据传输过程中对数据进程处理,降低网络通信负载,提高并行计算效率。增加互连网络中硬件对聚合通信功能的支持,并结合端上的软件调度来实现聚合通信加速已经成为目前领域内研究的热门问题。目前,国内尚没有公司或研究机构将基于软硬件结合方式实现加速聚合通信操作的方案应用到实际的工程领域中。本文通过模拟器的手段来探索基于路由器卸载的聚合通信操作加速方案的工程实现,主要取得了以下成果:在基于OMNe T++平台开发的x Net Sim Plus模拟器中,将具有MPI操作功能的节点模块移植到路由器内部,使得路由器具有了独立解析聚合通信报文的功能;并在此基础上,提出了高效的聚合通信逻辑树建立方案,该方案在建立过程中最大程度地贴合物理拓扑,尽可能地减少由于逻辑树和物理拓扑映射所带来的通信开销,进而减少聚合通信操作的所需时间。仿真结果表明,本文的路由器卸载方案最高可以加速Bcast操作910%,加速Reduce操作790%,加速Allreduce操作830%,加速Gather操作650%。
其他文献
复合固体推进剂是一种高颗粒含量的粘弹性复合材料,其力学性能一定程度上决定了固体发动机的结构完整性和贮存寿命,影响着固体导弹武器的可靠性和安全性。新一代导弹武器对固体推进剂力学性能提出了严峻挑战,现有设计方法难以满足要求,本文从细观尺度入手,基于二维Voronoi单元有限元方法(Voronoi Cell Finite Element Method,VCFEM),对推进剂的模量和泊松比等力学性能参数进
结构的轻量化不仅可以减少高精密复杂武器装备运行的能源消耗,而且可以为其带来更远的射程、更高的机动性以及更优越的动静态性能,是高精密复杂武器装备追求的关键指标。作为一种新型的轻质高强多功能结构,多胞填充结构可以在实现结构减重同时保持零件结构的力学性能,是一种实现高精密复杂武器装备轻量化设计的有效手段。针对传统均匀多胞结构设计时未考虑设计域内材料分布优化的不足,论文提出了一种面向激光增材制造的变密度多
热稠密等离子体中由光子和电子导致的连续原子过程是等离子体物理中的基础过程,其在确定等离子体电离平衡、状态方程和辐射不透明度中起着决定性的作用。最新的实验证据表明最新的理论在热稠密等离子体条件下显著低估了连续过程电离截面和速率。本文提出了热稠密等离子中连续电子瞬时空间局域化概念。连续电子瞬时空间局域化效应可以改变连续过程的基础物理性质。本文发展了一套研究考虑与等离子体环境耦合导致的量子退相干效应的连
Fe纤维具有高比表面积、大长径比、高磁导率、显著的磁各向异性等特性,是一种高效的微波吸收剂。但是,处于交变磁场中的Fe纤维表面会产生涡流,高电导率使趋肤效应更明显,导致微波在Fe纤维表面形成强反射,不利于Fe纤维对微波的吸收。研究表明,将Fe纤维的尺寸控制在纳米级别,可以有效地减少涡流的产生,提高阻抗匹配特性,降低Fe纤维表面对微波的反射。然而,Fe纳米线在使用中存在一些问题,如易团聚形成导电网络
六方氮化硼(h-BN)具有优异的综合性能以及特殊的二维结构,在众多高新技术领域具有十分广阔的应用前景。目前,h-BN材料的生长及制备工艺尚不成熟,现有的化学气相沉积(CVD)工艺温度高,腐蚀性强,工艺控制复杂,尚有很大的优化空间。本文以单组元氮化硼先驱体环硼氮烷为原料,采用化学气相沉积法,在石墨基底表面制备BN涂层,研究了沉积工艺对产物性能的影响,对CVD BN涂层的生长动力学进行了探究,分析模拟
强飞秒激光与原子、分子、凝聚态的相互作用蕴含着很多新的物理现象,是物理研究的前沿和重点。强场物理研究为人们探测和调控物质的超快动力学过程提供了强大的技术支持,具有重大的科学意义和应用价值。近年来,研究对象逐渐从原子分子向固体过渡。强激光场作用固体产生了极端非线性的电光学行为,实现了可以延伸到真空紫外和极远紫外区的固体高次谐波辐射,开启了固体强场物理研究的新时代。固体高次谐波不仅可以作为强阿秒脉冲源
分组密码是一类重要的对称密码。在众多评估分组密码安全性的分析方法中,不可能差分分析是一种非常有效的分析方法。本文以分组密码为研究对象,围绕不可能差分分析理论及应用展开研究。在结构不可能差分分析理论方面,首先,以已有的结构不可能差分理论为指导,针对基于LS设计理论的两个轻量级分组密码算法Fantomas和Robin,构造了比设计者给出的更长不可能差分。其次,针对两类特殊SPN结构,改进了结构不可能差
分数阶偏微分方程和随机分数阶偏微分方程理论已经被广泛应用到诸多工程和科学技术领域,能够更准确的描述复杂系统的演化规律。其理论分析和数值算法研究是一个核心热点问题。本文主要研究了带线性耗散项的分数阶非线性Schr?dinger方程和随机分数阶非线性Schr?dinger方程的解的适定性和数值算法构造及分析。论文共分七章,主要包括以下四部分内容:带线性耗散项的空间分数阶非线性Schr?dinger方程
拉丁超立方体设计在计算机试验设计,数值积分等领域中有广泛的研究和应用.本文围绕几类具体问题,研究了结构复杂的拉丁超立方体设计的理论与应用.主要工作与创新如下:1.构造了研究多精度试验问题的广义嵌套拉丁超立方体设计.针对普通嵌套拉丁超立方体设计存在的试验次数限制问题,提出了解决两精度试验问题的两层广义嵌套拉丁超立方体设计.该设计各精度试验次数灵活,可以很好地整合分析两精度试验.该类设计矩阵的抽样性质
阴极和收集极分别作为强流电子束起点和终点,对高功率微波源的性能具有重要影响。石墨是较好的爆炸发射阴极和强流电子束收集极材料,但其仍存在易释气、易造成系统碳污染等缺点,从而影响了石墨阴极和收集极在高功率微波源中的性能。目前,从材料角度改善石墨阴极和收集极性能的研究很少,对阴极表面材料成分和微观形影响其爆炸电子发射过程及性能的研究较少,对这一问题的认识仍然不够清晰。同时,高功率微波技术的发展对石墨阴极