基于多层次并行模型的矩阵乘算法的实现与分析

来源 :2008年全国高性能计算机学术年会 | 被引量 : 0次 | 上传用户:chencr33
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本研究从基于块的矩阵乘递归串行算法引申出基于Cannon 算法的多层次并行模型。在此基础上,通过MPI级上的通信域的创建、笛卡儿进程虚拟拓扑结构的建立以及引入OpenMP级的细粒度并行,实现了基于多层次并行模型的Cannon算法,并对纯MPI版本和多层次并行编程MPI+OpenMP版本的Cannon算法进行了不同计算规模的性能比较实验。实验和分析表明,MPI+OpenMP多层次并行模型性能高于纯MPI编程模型的性能。
其他文献
图像传感器网络随着低成本CMOS图像传感器等硬件技术的进步日益发展.为了解决图像传感器的方向性感知特性,提出一种基于非标定传感器图像进行场景重建的方法。该方法首先基于
会议
在无线传感器网络应用中,二元探测网络模型是一种经常被大家所使用的目标感知模型,以其实用性,常用于目标的定位和跟踪对其进行了推广,提出一种基于k位探测模型的无线传感嚣
会议
SAS统计软件在数据分析和统计分析领域获得了广泛应用,但是在某些模块的计算上,需要花费较长的时间才能得到较为精确的结果。随着双核成为计算机的主流,四核甚至多核CPU系统逐渐
会议
本文针对两种Godunov型格式:WAF格式和CTU格式,分别实现了并行自适应,通过数值计算及测试表明:在精度相同情况下,这两种格式都适合大规模并行自适应,具有很好的可扩展性。在单层上,W
所有描述贾科梅蒂雕塑作品的文字,都免不了孤独二字。瘦长嶙峋的身躯仿佛路灯下的影子,步履艰难的疲态下意识地流露出来。行走的人、单腿的人在粗糙的表皮下仿佛随时会如蜡烛般融化,并且深陷其中毫无办法。贾科梅蒂承认这种孤独,并且接受了自己的孤独。他曾说,“我是孤独的,因而被带入了一种必然性,反对这必然性,你就什么也做不了。如果我只是我所是,我就坚不可摧。是我所是,且毫无保留,我的孤独认出你的孤独。”  战后
本文对高性能计算机操作系统发展进行了研究。规模不断扩大的高性能计算机给其上运行的操作系统带来了巨大的挑战。操作系统总会在一定程度上影响应用程序的运行,引入系统噪声
会议
本研究分析了CBEA架构,通过对CBESDK进行封装和扩展,为Cell架构提供支持Pthread和MPI两层并行编程运行时支持库环境。通过扩展、优化SPE访存库为应用提供更高的运行效率和访存
我盆养库拉索芦荟多年,每到冬季,都按书上所说“……不耐寒,冬季室温不得低于5℃”的指导入室越冬。几年下来,芦荟们已是儿孙满堂,拥挤在狭小的花盆中。不得已,2004年春暖花
本文针对多区域多代码问题提出一种新的自动分块算法。考虑到整个计算空间由多个计算区域构成,该算法分两部分进行:首先,在计算区域间进行处理器分配,将处理器分配到各计算区域;然
本文中提出的算法以作业所需CPU数及预估运行时间构成的二维面积作为优先调度的条件,引入二级优先级和预约算法消除大作业的饥 饿现象,减少回填作业CPU数,相应增加预估运行时间,