基于非规则类矩形剖分的高效并行海浪数值模式

来源 :中国科学:地球科学 | 被引量 : 0次 | 上传用户:xigua871030
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对MASNUM全球海浪数值模式,设计了一种负载近绝对均衡的非规则类矩形剖分及计算格点序列化排序与交换方案,建立了高效并行海浪数值模式.基于国家超算济南中心的神威蓝光平台,对建立的全球并行海浪模式进行了1°×1°,(1/2)°×(1/2)°,(1/4)°×(1/4)°和(1/8)°×(1/8)°四种不同水平分辨率的无IO并行测试,测试规模达到131072进程.测试结果表明:随着进程数目的增多,四种分辨率并行模式的计算速度均在提高.当进程数目为基准进程数目的4倍时,四种分辨率的加速效率均在80%以上;当进程数目达到8倍基准进程数目时,1°×1°,(1/2)°×(1/2)°和(1/4)°×(1/4)°三种分辨率加速效率都还在80%以上,而此时(1/8)°×(1/8)°分辨率使用131072进程的加速效率仍可达62%;当进程数目为24倍基准进程数目时,1°×1°分辨率的加速效率可达72%,(1/2)°×(1/2)°分辨率的加速效率为62%,而此时(1/4)°×(1/4)°分辨率使用98304进程的加速效率仍可达到38%.从加速比和加速效率来看,采用非规则类矩形剖分的并行方案可以使得全球海浪数值模式具有高并行效率. According to MASNUM global ocean wave numerical model, a non-regular rectangular subdivision with approximate absolute equilibrium load and serialization and exchange of grids are designed, and an efficient numerical model of parallel ocean waves is established.Based on the state- (1 ° × 1 °, (1/2) ° × (1/2) °, (1/4) ° × (1/4) °, and (1/8)) of the established global parallel wave model. ° × (1/8) ° without IO test, the test scale reaches 131072. The test results show that as the number of processes increases, the computational speed of the four resolution parallel modes increases. When the number of processes is four times of the number of processes, the acceleration efficiency of the four resolutions is above 80%. When the number of processes reaches eight times the number of processes, 1 ° × 1 °, (1/2) ° × 1/2) ° and (1/4) ° × (1/4) ° Acceleration efficiencies are still above 80% at this time (1/8) ° × (1/8) ° Resolution The acceleration efficiency of the 131072 process can still reach 62%. When the number of processes is 24 times the number of reference processes, the acceleration efficiency of 1 ° × 1 ° resolution can reach 72%, (1/2) ° × (1/2) The resolution of the acceleration efficiency of 62%, while (1/4) ° × (1/4) ° resolution The rate of 98304 acceleration can still reach 38% with the acceleration rate and acceleration efficiency, the parallel scheme with irregular rectangular split can make the global wave numerical model have high parallel efficiency.
其他文献
目的 探究联合C反应蛋白(CRP)、降钙素原(PCT)、白细胞(WBC)应用于小儿感染性肺炎诊断过程中的临床效果.方法 简单随机选取2018年10月—2019年10月该院的感染性肺炎患儿100例
目的:探讨腹腔热灌注化疗结合热疗治疗卵巢癌的疗效.方法:现选取2017年2月-2018年2月入住我院的卵巢癌患者78例,按治疗方式分为两组,各39例,对照组仅予以腹腔热灌注化疗,研究
延髓(medulla oblongata)位于脑干下端,连接脑桥和脊髓,是人类的生命中枢,其血供较中脑、脑桥丰富.延髓解剖结构复杂,神经纤维密集,血管血供复杂,发生缺血损害时临床表现复杂
溶洞景观虽为局部景观之一种,若出形奇巧,亦能小中见大。本例九龙璧溶洞景观,厚实的上部顶面,平台开阔横展,峰峦舒缓圆顺。中部内收豁然洞开,洞内地面由右向左,台地由低而高,
担当禅师俗名唐泰,诗书画皆入高格,与八大等江南“四僧”为同时代人,故有并列“五僧”之说,虽未普遍接受,但有相当道理。大概人们已习惯以“四家”合称,也可能担当家居西南,
目的探析在血常规检验中应用静脉血检验与末梢血检验的效果。方法方便选择2019年1-12月期间血常规检验者88例,按照随机数字表法分为两组,每组44例,对照组接受末梢血检验,观察组接受静脉血检验,对比静脉血检验与末梢血检验对于检验结果的影响。结果观察组VAS疼痛评分为(2.12±0.37)分,对照组VAS疼痛评分为(2.01±0.59)分,组间差异无统计学意义(t=1.048,P=0.298>0.05);观察组红细胞平均血红蛋白量为(26.71±8.28)pg,红细胞压积为(0.56±0.22)%,对
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
目的:探讨大剂量倍他乐克在老年主动脉夹层中的临床疗效评价.方法:选择老年主动脉夹层患者20例作为研究对象,将患者随机分为大剂量倍他乐克组(10例)和常规剂量倍他乐克组(10
课前的话将字画装订成册,称为册页。册页的大小一般为四尺宣纸的六分之一,即画家们常说的四尺六开宣。一般画横幅,当然竖幅也可。画册页小品需要一个相当长的阶段,3个月、5个
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊