针对并行应用中大规模稀疏矩阵的通信优化研究

来源 :2006年全国高性能计算学术会议(HPC 2006) | 被引量 : 0次 | 上传用户:hzuns
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
矩阵运算是大规模并行应用中(如油藏数值模拟、天气预报等)普遍存在的计算形式,计算结果或计算过程中的矩阵常常是稀疏的.为了提高并行应用系统的效率,本文研究了针对大型稀疏矩阵的压缩通信问题.通过对矩阵压缩通信过程中矩阵稀疏度、网络带宽、处理器计算能力之间的关系进行定量分析,推导出稀疏度下界计算公式.通过对不同稀疏度情况下算法所取得的效率进行分析,总结出压缩通信中稀疏度与通信效率之间的函数关系.结合油藏数值模拟的应用实例,设计实现了稀疏矩阵的压缩通信算法,结果表明本算法在稀疏矩阵通信方面效率有明显的提高.
其他文献
数组数据流分析是并行编译中的重要技术,斯坦福大学的D. E. Maydan先生提供的LWT(Last Write Tree)算法是其经典分析方法.但是,原算法中计算LWT根节点的方法并不精确.本文提出了一种新的计算模型,能够精确有效地计算出LWT根节点中的约束范围.
利用Monte Carlo计算方法、实体结构几何法模型和三角形网络构造模型以及空间分割技术等,可以模拟电子束与任意形状试样的相互作用过程,从而了解扫描电子显微学中信号的产生机制以及图像衬度形成机理等.本工作中,我们利用MPI和OpenMP并行计算技术分别对其进行了几种不同的并行化以加速模拟,并对这些并行实现做了比较,分析了在扫描电子显微镜成像模拟中各种并行方式的优缺点及适用环境.
能力服务器是一种基于虚拟机技术的瘦客户端系统,具有良好的用户间隔离性并对多平台应用提供了更好的支持.但虚拟机的引入也带来了巨大的内部安全问题,并导致能力服务器中任何一对节点之间都需要进行双向身份认证、授权检查和信道保护.能力服务器采用了一种主从结构的分布式访问控制系统(称为DGuard)来解决这些问题.DGuard主系统的运行节点称为网格路由器(Grid Router,GR),从系统的运行节点称为
本文实现了全三维非线性流体力学与激光传播耦合并行模拟程序,用来研究高强度激光在稀疏等离子体中的激光成丝不稳定性.并行数值结果表明,在64台处理机上取得了较好的并行加速比.
多以太网卡并行通信是实现机群内部高效通信的重要手段,然而,受地址解析机制所限,现有的多以太网卡并行通信存在着依赖交换机绑定功能、不能主动控制通信负载、多网卡容错受限、网络配置复杂等问题.为此,本文提出并实现了一种面向机群并行通信的多以太网卡地址解析机制MARP,可有效支持单个IP地址和多个MAC地址之间的地址解析.测试结果表明,MARP与现有的以太网并行通信技术结合使用,可大幅提升机群通信的整体性
本文展示了一种在超级计算机上用扩散蒙特卡罗法(Diffusion Monte Carlo)解薛定谔方程的方法.这种方法可用于得到体系的基态零点能和波函数.本文基于扩散蒙特卡罗法中一种非常著名的算法--"随机游走"法(random-walk method),编写了相应的计算机程序,实现了一维谐振子模型的计算,并成功地将该程序扩展到多原子多维体系,应用于计算几种分子[CH5+、H3O2-、D3O2-、
随着税务数据向国家税务数据中心的集成,许多分布在各个城市的高性能服务器被闲置下来.我们利用这些闲置的服务器建立了一个基于开放的网格服务架构的省级税务网格.本文给出集成数据库、定义和构造基本的模块化网格服务以及采用Agent技术管理网格服务的具体方法.该方案使用面向服务的软件架构方法,成功地避免了资源浪费.实验证明它能极大地提高税务服务的质量.
随着遥感技术的快速发展,多源遥感图像的快速融合成为很多遥感任务的关键处理步骤.为了加速遥感图像的融合处理过程,本文首先提出了一种新的基于双树复小波变换的并行融合算法PACWT.算法中综合运用了数据分布、并行数据处理和负载均衡技术,以克服单机处理在计算能力和存储器空间上的限制;针对基于CWT的图像融合处理的计算特点,设计了一种可有效避免计算过程中数据通信的冗余划分方法.然后从理论上分析了算法在时间和
高性能集群具有大规模、廉价,高性能的特点,在提供给用户高性能的计算能力的同时,也给管理员对集群的管理带来了复杂性.目前集群管理系统还停留在管理员察看数据和事件并做出判断的阶段,给高性能集群的使用造成了庞大的管理开销.为了自动化管理员的操作,降低集群管理的复杂性,本文在分析大规模集群的自治需求的基础上,提出一种新型的集群自治框架, 提供整体化自治管理方案.通过使用中间件技术提供了良好的可扩展性和安全
随着峰值速度达280.6万亿次 IBM BlueGene/L 机群的投入使用,高性能计算机正面临着飞速发展,双核处理器的出现使得用户面临无处不在的并行.如何将已有的串行算法并行化并在并行计算机上实现成为高性能计算发展面临的迫切任务,本文尝试用OpenMP并行化gzip, 在机群的一个SMP节点(双CPU)环境下测试表明,性能得到了大幅度的提升.