基于GPU-like和GPU-CPU架构的异构片上网络的设计与研究

来源 :北京工业大学 | 被引量 : 4次 | 上传用户：liuxiaotiancxks

【摘要】

：

进入二十一世纪以来,多核处理器的设计发展迈向了两种不同的方向:一种是保持应用总体按序执行的CPU,另一种则是更适用于并行计算的GPU。GPU自诞生伊始便在浮点计算性能上超越

【作者】

：

冷镇宇

【机构】

：

北京工业大学

【出处】

：

北京工业大学

【发表日期】

：

2015年01期

【关键词】

：

GPU 片上网络异构性拓扑结构流量控制

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

进入二十一世纪以来,多核处理器的设计发展迈向了两种不同的方向:一种是保持应用总体按序执行的CPU,另一种则是更适用于并行计算的GPU。GPU自诞生伊始便在浮点计算性能上超越了CPU,GPU并行执行与CPU顺序执行性能之间巨大的鸿沟使得大量的程序开发人员将程序中计算密集型的部分交付给GPU进行计算。计算机体系结构已经从传统的多核CPU-like时代跨越到多核GPU-like和GPU-CPU异构时代。而当前设计的处理器芯片大都通过片上网络来访问共享资源,因此片上网络的配置对其性能和功耗有着重要影响。近期提出的异构片上网络不仅其性能进一步接近于传统的有缓冲区片上网络,而且其面积开销和功耗也明显下降。然而,面向GPU-like架构和GPU-CPU异构体系结构的异构片上网络设计目前尚未深入研究。GPU-like架构和GPU-CPU架构芯片为片上网络的设计提出了新的挑战。其一,Dennard定律的终结引发了处理器多核时代的暗硅问题,芯片的功耗限制使芯片上的晶体管点亮的数目达到了极限,导致处理器核心仅能在较短的时间里全部激活,大部分时间内,一些处理器核心区域无法激活,处于黑暗状态。而片上网络功耗在芯片整体功耗中比重很高,这驱使我们尽量降低片上网络的功耗,为核心保留更多的功耗预算。其二,与CPU相比,GPU线程数量更多,并行度高,这种特性使得GPU与末级高速缓冲存储器和存储控制器间的指令与数据交换更加频繁。基于CPU多核处理器的片上网络上的交通比较平均,而基于整合了GPU和CPU异构芯片的片上网络上的交通热点相对更集中,GPU迥异于CPU的特性改变了片上网络中的交通特征。如何使异构片上网络得以适应新型的GPU-like和GPU-CPU架构是当前亟待解决的问题。为此,本文首先针对芯片的暗硅问题,基于GPU-like芯片按照GPGPU负载对暗硅的适应程度将其分为暗硅敏感型、暗硅迟钝型和暗硅适应型三类。通过分析不同放置方式的异构片上网络对负载性能和片上网络功耗的影响,来探究异构片上网络对GPU-like芯片暗硅程度的影响。实验结果显示,相比于传统的有缓冲区片上网络,异构片上网络可以有效降低GPU-like芯片的暗硅程度,使芯片至少可以在额定功耗预算下多激活一个处理器核心。对于暗硅敏感型负载,在额定功耗预算下,使用异构片上网络至少提升了10%的性能,为额定功耗预算下片上网络类型的选择提供了参考。其次,基于GPU-CPU架构芯片,通过调整有缓冲区和无缓冲区路由器的放置方式,对多种基于"热土豆"路由的静态异构片上网络的性能和功耗进行了评估,实验结果对于进一步探索片上互联的设计空间是大有裨益的。最后,本文提出一种面向异构片上网络的基于信用的单向流控机制(UFC)来控制网络拥塞,从而保证有缓冲区路由器始终有空闲的缓冲区保存来自于相邻无缓冲区路由器的分片。实验结果显示,相比于"热土豆"路由,UFC可以将异构片上网络的性能平均提升14.1%,而网络的功耗平均提升仅有5.3%。

其他文献

多态依赖蕴含判定方法的研究

XML(eXtensible Markup Language,可扩展标记语言)定义了一种数据格式,这种数据格式允许用户自己定义标记,来描述特定应用领域的数据,以这种格式描述的数据形成的文件称为XML

学位

XML函数依赖多态依赖蕴含判定

基于WRF大气数值模式的高性能计算研究与应用

随着计算机技术的迅速发展和硬件水平的快速提升，尤其是近年来高性能计算机和并行技术的发展，气象、生态问题的高性能计算应用显得日益重要。本课题内容基于国家973项目“高性

学位

高性能计

OnceDI中语义数据集成支持工具的设计与实现

计算机网络的迅速发展推动了信息化和全球化的进程。企业与企业之间，企业的各部门之间，信息交换越来越频繁。由于地理位置的分布性和所采用的技术的多样性，直接导致了数据资源的

学位

语义数据

基于可信度的OpenFlow网络多拓扑路径选择技术研究

互联网技术和应用的飞速发展对网络信息传输安全和服务质量保证提出了严峻的挑战,建立高可信的网络服务已经成为网络应用发展的迫切需求。目前可信网络相关技术的研究重点集

学位

OpenFlow路径选择可信度量多拓扑

监测数据驱动的交通仿真可视化方法研究

学位

连续状态空间的强化学习问题

强化学习作为一种强有力的机器学习方法，其有效性已经在很多领域得到证明。它研究的是一个很普遍的问题：即如何在一个未知的动态环境中学习，以找到最优的行为策略。强化学习给人

学位

机器学习强化学习连续状态空间价值函数蒙特卡罗算法

多角度人脸识别的深度学习方法研究

多角度人脸识别是模式识别中极具挑战性的课题,在军用和民用领域有着广阔的应用前景,其目的是让计算机等机器能够自动辨认出各个角度的人脸图像。由于人脸的复杂性和微妙性,

学位

多角度人脸识别自编码器受限波尔兹曼机

家庭网关软件系统的设计与实现

随着多媒体通信技术的飞速发展，多种业务的融合已经成为网络发展的一个趋势。社区宽带综合业务网络系统使用交换式以太网技术，在一个物理网络上实现常规电话网、数字电视网、计

学位

网络融合

基于粗糙集加权的朴素贝叶斯分类模型的应用研究

数据挖掘是当前人工智能研究领域非常活跃的一部分,是后者的核心内容之一。粗糙集理论是一种能够处理不精确和不确定性问题的数学工具,有着坚实的理论基础。本文主要围绕基于

学位

粗糙集朴素贝叶斯病案分类智能导医

理性主体实际推理过程的逻辑建模

20世纪50年代人工智能学界就提出了主体(Agent)的概念.("agent"一词目前国内还没有统一的译法,常见的译名包括"主体"、"智能代理"、"智能体"、"艾真体"等.本文选用"主体"的译

学位

人工智能实际推理过程LOCA逻辑软件开发

基于GPU-like和GPU-CPU架构的异构片上网络的设计与研究

与本文相关的学术论文