论文部分内容阅读
CPU-GPU异构多核系统架构近年来被学术界广泛地研究。在CPU-GPU异构多核系统中,片上网络作为重要的共享资源,被CPU、GPU频繁地竞争。制定一个最优的片上网络仲裁机制对于系统整体性能至关重要。 本文通过实验数据观察和理论分析发现在CPU-GPU异构多核系统中,由于GPU程序的网络注入率往往要远高于CPU程序的网络注入率,GPU程序会垄断片上网路共享资源。其结果是CPU程序由于受到GPU程序的影响,性能下降很大。本文通过对CPU程序、GPU程序特征的分析,发现CPU程序、GPU程序具有不同延迟敏感度的特征,以及CPU类型、GPU类型数据包具有时间裕量的特征。因此本文提出基于数据包的时间裕量和程序延迟敏感度的SLT片上网络仲裁机制。其中S表示数据包的时间裕量(Slack);L表示延迟敏感度(latency sensitivity);T表示数据包的类型(type)。 本文使用Gem5-gpu仿真器进行实验,通过实验数据判断SLT仲裁机制的优劣。并且对CPU程序和GPU程序进行了合理的分类。CPU程序分为计算密集型、访存密集型以及流程序这三类。GPU程序分为高网络注入率高延迟敏感度、高网络注入率低延迟敏感度、低网络注入率高延迟敏感度、低网络注入率低延迟敏感度四类。相对于基准循环调度仲裁机制系统中CPU、GPU的性能,SLT仲裁机制系统中的整体性能有很大的提升,系统的CPU性能平均提高了13.2%,CPU程序性能最大提升情况幅度可达34.1%,GPU性能平均下降了2.8%。同时SLT仲裁机制也可以提升低注入率高延迟敏感度类型GPU程序的性能,最大提升情况幅度可达5.2%。