论文部分内容阅读
虽然Fortran常用来进行科学计算,但是面对计算量大的程序仍然很耗时。通常人们用MPI进行粗粒度的并行来提高程序的运行效率,近年来随着GPU计算能力的提高,将程序进行细粒度GPU并行化成为一种趋势。文章基于NVIDIA公司的CUDA框架,就Fortran程序向CUDA移植过程中的一些问题进行总结,并给出了相应的解决方案。