激光成丝不稳定性三维并行数值模拟研究

来源 :2006年全国高性能计算学术会议(HPC 2006) | 被引量 : 0次 | 上传用户:snowliya
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文实现了全三维非线性流体力学与激光传播耦合并行模拟程序,用来研究高强度激光在稀疏等离子体中的激光成丝不稳定性.并行数值结果表明,在64台处理机上取得了较好的并行加速比.
其他文献
最少比较排序问题就是要研究在最坏情况下,对n个元素完成排序所需要的最少比较次数S(n).1965年M.Wells用穷举法证明S(12)=30, 2002年到2004年,M.Peczarski计算得到S(13)=34、S(14)=38、S(22)=71.本文改进了线性扩展计数算法、Wells算法、Peczarski算法,使时间代价大幅降低,并设计了一个新的算法PS算法.通过对Wells算法、Pecz
矩阵计算在科学计算和其它很多的领域中有着广泛的应用.而随着计算机体系结构的不断发展,尤其是分层存储的出现,现有的经典矩阵计算算法和传统数据结构已经不太适应新硬件发展的需要了.本文主要通过分析存储层次对矩阵计算的影响,结合近年来国内外的一些研究成果,提出了一种矩阵计算理念--计算重排序理论,并在此基础上提出了一种面向存储层次解决矩阵计算问题的方法--综合递归分块方法.对比实验表明,采用该方法既可以提
动态二进制翻译是解决兼容问题的重要手段,它能够将为源平台编译的二进制代码直接运行在目标平台上.指令调度作为一种有效的编译优化技术,也适用于动态二进制翻译.本文在对gcc指令调度器分析研究的基础上,结合动态二进制翻译的实时性特点,提出了适合动态二进制翻译的效率高、开销小的指令调度算法.
副本管理是数据网格系统中重要的研究课题之一,针对数据网格系统中副本数量日益增多,分布范围日益广泛的发展趋势,提出了构建于结构化P2P网络之上的分布式副本信息管理机制P-DRMM,通过Overlay网络中的路由机制实施所有的副本信息更新和查找操作,使得副本的管理变得简单而有效,为快速有效地访问数据网格中的数据提供了一个良好的底层机制.在设计Overlay网络节点的路由表时结合了小世界模型的思想,理论
本文针对Chord模型在资源发现和定位中存在的效率问题,设计了一种用于提高资源发现和定位效率的扩展模型-RL模型.RL模型在两方面对Chord模型进行了改进,RL模型使用双向指取表,使搜索能从P2P环的两个方向同时进行;通过对节点进行分类排除了干扰节点,并减少资源定位所需的跳数.从而使搜索系统能更好的完成对P2P网络资源的定位.本文详细描述了RL模型的结构和资源定位的原理,给出了资源定位的示例,介
随着高性能并行计算技术的发展,并行程序的调试越来越重要,本文介绍了一种异构环境下的并行调试工具的设计.通过对并行程序源代码的分析处理,利用自动插桩模板插入用于调试的用户代码,从而对并行程序进行断点调试和性能参数收集,通过程序运行过程中内存变量值的查看,可以检查出异常变量,再对源并行程序进行调试,达到进一步优化程序设计的目的.
数据划分技术是分布式存储超级计算机应用的关键所在,也是困难所在.当多个循环间数据划分出现冲突时,现有的数据划分方法不能进行有效的数据划分.本文提出了一种基于幺模变换的数据划分方法,它在总体把握多个循环的数据划分约束关系的条件下寻找数据划分的可能,实际应用程序的测试结果都显示该数据划分十分有效.
数组数据流分析是并行编译中的重要技术,斯坦福大学的D. E. Maydan先生提供的LWT(Last Write Tree)算法是其经典分析方法.但是,原算法中计算LWT根节点的方法并不精确.本文提出了一种新的计算模型,能够精确有效地计算出LWT根节点中的约束范围.
利用Monte Carlo计算方法、实体结构几何法模型和三角形网络构造模型以及空间分割技术等,可以模拟电子束与任意形状试样的相互作用过程,从而了解扫描电子显微学中信号的产生机制以及图像衬度形成机理等.本工作中,我们利用MPI和OpenMP并行计算技术分别对其进行了几种不同的并行化以加速模拟,并对这些并行实现做了比较,分析了在扫描电子显微镜成像模拟中各种并行方式的优缺点及适用环境.
能力服务器是一种基于虚拟机技术的瘦客户端系统,具有良好的用户间隔离性并对多平台应用提供了更好的支持.但虚拟机的引入也带来了巨大的内部安全问题,并导致能力服务器中任何一对节点之间都需要进行双向身份认证、授权检查和信道保护.能力服务器采用了一种主从结构的分布式访问控制系统(称为DGuard)来解决这些问题.DGuard主系统的运行节点称为网格路由器(Grid Router,GR),从系统的运行节点称为