大规模并行自适应有限元计算中的负载平衡研究

来源 :2014全国高性能计算学术年会 | 被引量 : 0次 | 上传用户：milo999

【摘要】

：

偏微分方程的并行求解,关键问题之一是网格划分,它不仅要求每个进程拥有相等的计算负载,同时要求有良好的划分质量,以减少进程间通信.在自适应有限元计算过程中,网格/基函数不断调整,会导致负载不平衡,必须动态地调整网格分布,从而实现动态负载平衡,本文研究了小同的负载半衡方法,并在并行自适应有限元平台PHG中实现.数值实验表明动态负载平衡算法具有很高的划分质量,运行速度快,可有效划分网格并减少运行时间.

【作者】

：

刘辉崔涛冷伟张林波

【机构】

：

科学与工程计算国家重点实验室,数学与系统科学研究院,中国科学院

【出处】

：

2014全国高性能计算学术年会

【发表日期】

：

2014年7期

【关键词】

：

偏微分方程数值解法并行自适应有限元计算动态负载平衡网格划分

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

基于Dynaform的等厚拼焊板成形时拉深性能及焊缝移动研究

激光拼焊板可以有效地减轻汽车重量,提高汽车整体结构强度,从而提高碰撞安全性,在汽车工业中受到了越来越广泛的应用.本文运用板料成形专业软件Dynaform,主要模拟了等厚(1.0mm)拼焊板筒形件拉深成形过程,分析和研究了母材不同强度比以及焊缝位置对中焊缝移动和拉深性能的影响规律.结果表明:等厚拼焊板拉深性能和焊缝移动量与两种母材强度比和焊缝位置有关,随着母材强度比的增大,焊缝向强度高的母材一侧移动

会议

拼焊板拉深性能焊缝移动数值模拟Dynaform软件

流化床实时模拟中的高性能计算

化工过程的实时模拟是化工界长久以来的梦想,有望彻底改变其研发模式.但其计算量巨大,传统模拟的速度与实时相去5～6个量级,实现希望渺茫.近年来异构超级计算机发展迅速为此带来了希望.开发了适用于异构系统的多尺度并行计算软件,已可实现气固流态化过程的准实时模拟.对于涉及复杂迭代和矩阵操作的气体计算,采用CPU处理;对于包含大量简单运算的颗粒计算,采用GPU加速.采用能量最小多尺度模型(EMMS),对流化

会议

化学工业流化床过程模拟高性能计算能量最小多尺度模型

基于AWGR的OCS/EPS数据中心光电混合网络

随着云计算和各种大数据应用技术的发展,数据中心的数量和规模得到了迅速的发展,为了满足大规模服务器之间数据流动的需求,数据中心网络在通信能力上面临巨大的挑战.为了增加数据中心网络的通信能力,本文基于现有数据中心的树形网络拓扑,提出了一种使用AWGR和TWC光器件的OCS/EPS光电混合网络结构Ace-net;在文中详细描述了此结构的整体设计以及带宽需求测量、仲裁控制、流量分配等各个子系统的运作方式;

会议

数据中心光电混合网络阵列波导光栅路由器可调谐波长变换器性能测试

基于事件驱动采样技术的链接后预取优化

数据预取是通过隐藏访存延迟改善应用性能的有效方法.反馈式优化技术可以解决基于指针的链式数据结构的预取问题.本文在申威1600处理器上实现了基于硬件性能计数事件驱动的采样式反馈预取优化,对部分访存密集型SPEC2006的测试表明:平均性能提高了4.3％,同时采样的开销控制在10％以内.

会议

微处理器访存延迟现象数据预取反馈式优化技术事件驱动采样技术

快速多极方法计算主部的MIC并行性能优化

快速多极方法是科学与工程计算的典型算法之一,具有广泛用途.本文以求解位势问题为例,研究快速多极方法计算主部在集成众核(MIC)架构的并行计算及优化,涉及OpenMP线程并行、访存、数据通信、向量化等方面,分析比较了快速多极方法计算核心在优化前后的MIC和CPU性能加速.结果表明,快速多极方法计算主部在集成众核架构上获得了20.8的性能提升,单MIC卡性能相当于单结点双路CPU性能的1.95倍.

会议

集成众核并行计算性能优化快速多极方法

一个面向文本数据的统计分析系统

伴随信息社会的迅猛发展,大量数据不断地产生出来.这其中,有相当一部分是由电信网络以及社交网络产生的文本数据,如短信、彩信、微博客、即时通讯等.随着上述应用的不断普及与发展,数据产生的速度也在不断地增长,这给数据分析带来新的挑战.在某些应用场景下,对文本数据分析具有较高的性能要求,因此需要分析系统具有良好的实时分析响应能力.然而,面向通用数据类型而设计的分析系统,如数据库、数据仓库等,虽然可以对文本

会议

文本数据统计分析系统并行处理性能测试

耗散粒子动力学及Lees-Edwards边界条件的GPU并行算法与实现

本文一方面介绍了基于GPU实现高效和大规模耗散粒子动力学(DPD)模拟的完整方法,并针对DPD模拟技术的特点,进行了算法设计和优化,以便其能充分发挥GPU的计算能力.另一方面,Lees-Edwards(LE)周期性边界条件由于不需要固体壁面拖动,通过一系列简单的变换,可以在无限大系统内得到定常剪切率,被广泛应用于耗散粒子动力学中模拟剪切流动.本文发展了基于GPU的LE边界条件高效算法.标准模型的模

会议

耗散粒子动力学Lees-Edwards周期性边界图形处理器并行算法模拟分析

基于MPI的并行文本特征关联分析算法

随着文本挖掘技术的迅速发展,文本知识发现得到越来越多研究人员的关注,而关联分析作为数据挖掘研究中一个重要的研究课题,也在一些文本信息领域得到广泛的应用.但是现在各个领域的信息量都在以几何级的速度增长,传统的串行关联分析算法已经远远不能满足需求.本文介绍了一种用于在文本数据集上挖掘关联规则的新算法,并使用MPI消息传递接口对算法进行并行化.算法主要通过构造分布式倒排哈希索引,结合棋盘分解的通讯模式来

会议

文本挖掘关联分析并行处理多点接口

一种面向大规模系统域网络性能评估模型

针对大规模系统域网络如何有效监控大规模网络流量、发现网络性能瓶颈和潜在故障点,为网络性能优化提供支持成为新的研究课题,本文首先提出了针对系统域网络的性能管理体系结构SPMA,SPMA采用了松耦合的分层结构,通过各层之间的协同实现性能管理的自动化和可操作性,在此基础上提出了一种网络性能评估模型NPEM,解决大规模网络中对现有网络设备性能状况无法正确评估,对网络运行状态无法进行有效预测的问题,进而提出

会议

系统域网络性能优化评估模型分层结构

基于集成众核的3D蒙特卡罗半导体器件模拟

3维蒙特卡罗器件模拟计算量大,计算量随网格与粒子数增加而急剧增加.通过分析3D蒙卡模拟加速热点和进一步可并行性,研究有效电势方法的集成众核并行方案;研究粒子自由飞行、统计模拟信息、计算表面粗糙散射等热点并行方案,最终实现基于CPU/MIC的三级并行3维蒙特卡罗器件模拟软件.实验结果显示三级并行比单级并行获得更好的性能;当提高模拟精度时,三级并行蒙特卡罗模拟对单级并行加速比增加.

会议

半导体器件三维蒙特卡罗模拟集成众核有效电势并行处理

大规模并行自适应有限元计算中的负载平衡研究

与本文相关的学术论文