面向千万亿次计算的可扩展、可容错自由网格粒子模拟系统与应用

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:windFWF1992
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
可扩展和可容错是当前超级计算面临的两大关键技术。以千万亿次超级计算机的出现为标志,数值模拟已经进入一个全新的时代。一个高性能数值模拟程序可以使用数十万甚至数百十万个处理器核进行超大规模并行计算的时代。同时,系统故障发生概率随着节点数增加而放大。超级计算机的平均无故障时间,由于概率递增的客观规律,不可避免地下降。因此,高效使用千万亿次超级计算机进行工程与科学计算的前提是发展具有良好可扩展性和可容错性的数值模拟软件。  近年来新兴的无网格粒子方法形成对传统有限元等数值模拟技术的补充。无网格粒子方法无需固定节点连接关系,可以有效模拟固体材料大变形、在拉格朗日格式下统一求解固体、流体力学以及固体变形与流体流动耦合问题。在众多无网格粒子模拟算法中,物质点法(MPM)和光滑粒子流体动力学(SPH)方法是两类成熟、具有广泛适用性的无网格粒子方法。这类算法相对于传统有限元的优越性得到学术界的普遍认可。但是,由于诞生较晚,这类算法的大规模并行化和商业化起步较晚。  本论文研究上述两类粒子方法大规模并行计算的统一实现框架,解决使用千万亿次超级计算机所面临的高可扩展和可容错问题关键技术,发展一套千万亿次无网格粒子模拟系统,最终实现超大规模测试、工程计算和应用。  论文创新点如下:  (1).研究并实现了SPH和MPM在千万亿次超级计算机上的高效并行化,首次在统一框架下研制了高性能数值模拟应用软件petaPar,并在当时排名世界第一的Titan千万亿次超级计算机上,通过了全系统26万核的高可扩展计算,并行效率达到96%;  (2).发展了千万亿次计算的可容错关键技术,通过变进程重启动功能实现了petaPar无人值守自动容错计算,在同类算法的大规模数值软件中类似功能尚未见公开报道;  (3).基于petaPar在“天河二号”和Titan千万亿次超级计算机上“接力”完成某核反应堆的3亿粒子规模的结构抗震反应分析和10万块体离散系统的非连续变形等具有挑战性的工程计算问题,对petaPar的并行计算能力进行了验证。
其他文献
目前计算机软件的规模越来越大,复杂度也不断提高,软件错误造成的后果也就越来越严重,软件的质量和可靠性已引起人们的高度重视。在现代软件工程中,软件开发的各个阶段,都应进行相
在大数据背景下,空间分析作为地理信息服务的核心,呈现出两种主要发展趋势。一是大规模空间数据的精确分析。随着空间数据采集技术的进步,人们可以获得的空间更加广泛,空间数据规
目前,互联网应用环境日益复杂,安全危机频发。网络上的个人计算机随时都可能遭到各种恶意攻击,这些攻击导致的后果可能是上网账号被窃取,银行账号被盗用,电子邮件密码被修改,财务数
随着GNSS(Global Navigation Satellite System)现代化的建设和全球定位技术的不断发展,卫星导航产业也在迅速地发展,并已经成为人们生活中不可或缺的组成部分。随着人们对于GN
IP组播技术是一种有效的多目标传输机制,具有广阔的应用前景。但是目前的组播协议缺乏安全机制满足组播应用的安全性要求。IP组播是一个开放的系统,每一台主机都可以通过发送:IG
超并行处理(Hyper Parallel Processing,HPP)体系结构是国家智能计算机研究开发中心提出的一种新的面向千万亿次计算的超级计算机体系结构.它在保持了系统较高的扩展性的同时
近年来,移动智能设备如手机、平板电脑等,变得越来越普及,随着移动互联网的发展,人们接入网络也越来越方便和迅速。此外,越来越多的人选择分享自己生活经历相关的图像到社交网络,这
随着高等教育规模的扩大,学分制的实施,教学管理工作变得越来越复杂。为了适应新的教学模式提高教学管理的工作效率,各高校都相继开展了教学信息化建设,建立了自己的教学管理信息
不断增长的片上晶体管数量和功耗预算的上限限制造成了“利用率墙”问题的出现。为特定应用和算法设计加速器被认为是提高效能、缓解“利用率墙”问题的重要方法之一。然而,当
教学评价是一个复杂的过程,它依据一定的教学目标和规范,对学校教学情况进行系统检测和考核,评定教学效果和教学目标的实现程度,并做出相应的价值判断。教学评价过程具有复杂性、