论文部分内容阅读
集群作业管理系统目前对GPU资源的管理还不是很完善,尤其在单节点多GPU的情况下,经常由于GPU设备的使用冲突、负载不均等原因而导致GPU设备利用率低。为此,本文设计并实现了一种基于共享内存方式的GPU资源调度器,结合集群作业管理系统,可以自动为用户作业分配需要的GPU设备资源,避免多个GPU设备的使用冲突,从而使得GPU设备的使用率达到最高。基于SAPPORO的GPU多体模拟程序在本系统环境下得到了很好的应用。