论文部分内容阅读
SMP集群混合了两个内存模型:每个节点是一个共享存储的多处理器,而节点间使用分布存储.这一多级体系结构引起了编程模型和性能方面的问题.文章讨论了MPI+OpenMP混合编程模型的性能和不同的实现方法,提出了多粒度MPI+OpenMP混合编程方法.建立了对称三对角特征问题的多粒度混合并行算法,并在深腾6800超级计算机上同纯MPI算法作了性能方面的比较.结果表明,该混合并行算法具有更好的扩展性和加速比.