论文部分内容阅读
MAGMA是第一个面向下一代体系架构(多核CPU和GPU)开源的线性代数软件包,它采用了诸多针对异构平台的优化方法,包括了混合同步,通信避免和动态任务调度系统.它在功能,数据存储,接口上与LAPACK相似,可以发挥GPU的巨大计算能力进行数值计算.本文首先对MAGMA中的矩阵分解算法进行分析;然后通过测试结果,分析 MAGMA有效的优化和并行方法,为 MAGMA使用、优化提供有益的建议;最后本文提出了一种对于矩阵分块算法的自适应调优的方法,经过测试,对于SGEQRF函数加速比达到1.09.