CPU-GPU片上异构多核系统内网络仲裁机制研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:lewllen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
CPU-GPU异构多核系统架构近年来被学术界广泛地研究。在CPU-GPU异构多核系统中,片上网络作为重要的共享资源,被CPU、GPU频繁地竞争。制定一个最优的片上网络仲裁机制对于系统整体性能至关重要。  本文通过实验数据观察和理论分析发现在CPU-GPU异构多核系统中,由于GPU程序的网络注入率往往要远高于CPU程序的网络注入率,GPU程序会垄断片上网路共享资源。其结果是CPU程序由于受到GPU程序的影响,性能下降很大。本文通过对CPU程序、GPU程序特征的分析,发现CPU程序、GPU程序具有不同延迟敏感度的特征,以及CPU类型、GPU类型数据包具有时间裕量的特征。因此本文提出基于数据包的时间裕量和程序延迟敏感度的SLT片上网络仲裁机制。其中S表示数据包的时间裕量(Slack);L表示延迟敏感度(latency sensitivity);T表示数据包的类型(type)。  本文使用Gem5-gpu仿真器进行实验,通过实验数据判断SLT仲裁机制的优劣。并且对CPU程序和GPU程序进行了合理的分类。CPU程序分为计算密集型、访存密集型以及流程序这三类。GPU程序分为高网络注入率高延迟敏感度、高网络注入率低延迟敏感度、低网络注入率高延迟敏感度、低网络注入率低延迟敏感度四类。相对于基准循环调度仲裁机制系统中CPU、GPU的性能,SLT仲裁机制系统中的整体性能有很大的提升,系统的CPU性能平均提高了13.2%,CPU程序性能最大提升情况幅度可达34.1%,GPU性能平均下降了2.8%。同时SLT仲裁机制也可以提升低注入率高延迟敏感度类型GPU程序的性能,最大提升情况幅度可达5.2%。
其他文献
期刊
在自贸试验区等国家战略背景下,跨境电子商务已成为新兴产业发展和供给侧结构性改革的“黑马”。今年4月厦门自贸片区跨境电商产业园区业务批次环比增长258%、342%,5月进境个
期刊
期刊
期刊
先天性人巨细胞病毒(Human cytomegalovirus,HCMV)感染是导致胎儿神经系统发育畸形,如听力损伤、智力低下、脑室壁钙化、小脑畸形等出生缺陷最常见的病原性病因。入神经前体/干
随着近年来半导体工业的飞速发展,电子设备的价格与功耗不断降低,无线传感器网络及可穿戴式健康检测设备得以被广泛应用,但这些微型电子设备的电池续航能力在实际应用中并不理想
石墨烯是一种重要的单层蜂窝状结构的碳材料,具有优异的电学、热学、光学和力学性能,在电学器件、光电器件以及储能器件上面有着重要的应用。  本文使用化学气相沉积(CVD)方
丝状真菌顶头孢霉(Acremonium chrysogenum)是β-内酰胺类抗生素头孢菌素C(cephalosporin C)的重要工业生产菌株。自噬在真核细胞中降解自身蛋白和细胞器过程中发挥重要作用。
同步扫描条纹相机是一种拥有很高的灵敏度和很大动态范围的超快诊断仪器,在对高时间分辨率的微弱光线的探测上拥有独特的优势。同步扫描条纹相机是将需要被探测的重复发光信号照射到光阴极上,光阴极产生的光电子通过加速聚焦后,被偏转板上和光信号严格同步的高频正弦信号的准线性区沿时间扫开,然后在荧光屏上进行精准的叠加,从而实现对重复微弱光信号的高速探测。由上述原理可知,同步扫描条纹相机的时间分辨特性主要取决于高频