CPU-GPU片上异构多核系统内网络仲裁机制研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：lewllen

【摘要】

：

CPU-GPU异构多核系统架构近年来被学术界广泛地研究。在CPU-GPU异构多核系统中，片上网络作为重要的共享资源，被CPU、GPU频繁地竞争。制定一个最优的片上网络仲裁机制对于系统整

【作者】

：

蔡想伟

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2017年期

【关键词】

：

片上网络仲裁机制中央处理器图形处理器

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

CPU-GPU异构多核系统架构近年来被学术界广泛地研究。在CPU-GPU异构多核系统中，片上网络作为重要的共享资源，被CPU、GPU频繁地竞争。制定一个最优的片上网络仲裁机制对于系统整体性能至关重要。　　本文通过实验数据观察和理论分析发现在CPU-GPU异构多核系统中，由于GPU程序的网络注入率往往要远高于CPU程序的网络注入率，GPU程序会垄断片上网路共享资源。其结果是CPU程序由于受到GPU程序的影响，性能下降很大。本文通过对CPU程序、GPU程序特征的分析，发现CPU程序、GPU程序具有不同延迟敏感度的特征，以及CPU类型、GPU类型数据包具有时间裕量的特征。因此本文提出基于数据包的时间裕量和程序延迟敏感度的SLT片上网络仲裁机制。其中S表示数据包的时间裕量(Slack);L表示延迟敏感度(latency sensitivity);T表示数据包的类型(type)。　　本文使用Gem5-gpu仿真器进行实验，通过实验数据判断SLT仲裁机制的优劣。并且对CPU程序和GPU程序进行了合理的分类。CPU程序分为计算密集型、访存密集型以及流程序这三类。GPU程序分为高网络注入率高延迟敏感度、高网络注入率低延迟敏感度、低网络注入率高延迟敏感度、低网络注入率低延迟敏感度四类。相对于基准循环调度仲裁机制系统中CPU、GPU的性能，SLT仲裁机制系统中的整体性能有很大的提升，系统的CPU性能平均提高了13.2％，CPU程序性能最大提升情况幅度可达34.1％，GPU性能平均下降了2.8％。同时SLT仲裁机制也可以提升低注入率高延迟敏感度类型GPU程序的性能，最大提升情况幅度可达5.2％。

其他文献

'素心'蜡梅中花被片变色现象研究

期刊

适应新趋势推动跨境电商跨越发展

在自贸试验区等国家战略背景下,跨境电子商务已成为新兴产业发展和供给侧结构性改革的“黑马”。今年4月厦门自贸片区跨境电商产业园区业务批次环比增长258%、342%,5月进境个

期刊

共存互补跨境电商信息管理井喷式增长战略背景电子商务环比平台企业活跃度结构性改革

梅叶绿体分离与测序方法优化

期刊

南京梅花国际登录新品种及梅花栽培管理技术研究

期刊

北京地区优良梅花栽培品种茎段启动培养研究

期刊

人巨细胞病毒对干细胞的感染与影响

先天性人巨细胞病毒(Human cytomegalovirus，HCMV)感染是导致胎儿神经系统发育畸形，如听力损伤、智力低下、脑室壁钙化、小脑畸形等出生缺陷最常见的病原性病因。入神经前体/干

学位

巨细胞病毒病毒复制双皮质素基因表达

高效能压电能量收集电路的分析与实现

随着近年来半导体工业的飞速发展，电子设备的价格与功耗不断降低，无线传感器网络及可穿戴式健康检测设备得以被广泛应用，但这些微型电子设备的电池续航能力在实际应用中并不理想

学位

压电能量收集等效模型接口电路转换效率

石墨烯的合成关键技术及其性能研究

石墨烯是一种重要的单层蜂窝状结构的碳材料，具有优异的电学、热学、光学和力学性能，在电学器件、光电器件以及储能器件上面有着重要的应用。　　本文使用化学气相沉积(CVD)方

学位

石墨烯化学气相沉积铜箔表面单晶缺陷载流子迁移率

顶头孢霉中自噬相关基因Acatg11的功能研究

丝状真菌顶头孢霉（Acremonium chrysogenum）是β-内酰胺类抗生素头孢菌素C(cephalosporin C)的重要工业生产菌株。自噬在真核细胞中降解自身蛋白和细胞器过程中发挥重要作用。

学位

丝状真菌次级代谢细胞自噬基因表达

同步扫描条纹相机的扫描电路研究

同步扫描条纹相机是一种拥有很高的灵敏度和很大动态范围的超快诊断仪器,在对高时间分辨率的微弱光线的探测上拥有独特的优势。同步扫描条纹相机是将需要被探测的重复发光信号照射到光阴极上,光阴极产生的光电子通过加速聚焦后,被偏转板上和光信号严格同步的高频正弦信号的准线性区沿时间扫开,然后在荧光屏上进行精准的叠加,从而实现对重复微弱光信号的高速探测。由上述原理可知,同步扫描条纹相机的时间分辨特性主要取决于高频

学位

条纹相机同步扫描扫描电路锁相环直接数字频率合成

CPU-GPU片上异构多核系统内网络仲裁机制研究

与本文相关的学术论文