一种基于遗传算法的GPGPU极限功耗测试框架

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:ding7881
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为一种新兴的计算平台,图形处理器(GPU)在科学计算和工程领域展现出巨大的计算能力。GPU也很快由单纯的图形处理加速单元,演变成适合通用计算的处理器(GPGPU)。然而随着计算性能和存储带宽的提升,GPGPU的功耗也由以前的几十瓦增大到数百瓦,严重影响了GPGPU系统的设计,这使得功耗成为设计高性能GPU系统首先考虑的重要指标之一。热设计功耗是衡量GPU的热量释放的指标,决定GPU冷却模块和电源模块的功耗设计。通常热设计功耗来自GPGPU满负荷状态下实际能达到的极限功耗值。因此,准确地测试极限功耗对高性能GPGPU的设计有重要的意义。大量并行的计算核心、多层次的存储系统和复杂的内部互联结构使得GPU实际的极限功耗测试工作极其困难。传统的做法是手工编写功耗病毒程序进行测试。这种方法繁琐耗时,要求设计人员精通GPGPU体系结构和编译器原理。通常,手工编写的功耗程序无法保证测得的极限功耗的准确性,且不适用于不同的GPGPU体系结构。针对上述问题,本文深入研究了当前GPGPU主流基准测试程序的功耗特征,设计了一种基于遗传算法的GPGPU极限功耗测试框架。本框架首先通过一种基于随机森林的功耗分析模型对程序功耗影响因子进行分析,抽象出用于参数化描述功耗负载的负载模型。然后结合框架设计的代码合成算法生成相应的功耗负载模型搜索空间,最后由机器学习模块SNAP使用遗传算法对负载模型空间进行自动化搜索求出极限功耗最优解。本文借助gpgpu-sim和gpgpu-wattch模拟器对NVIDIA公司的GTX480和quadro FX5600两款GPGPU进行测试。实验表明使用自动化框架测得的两款GPU的极限功耗分别比当前主流GPGPU基准测试程序测得的最大功耗高出19%和14%。同时结合静态功耗,框架测得极限功耗与官方设计的TDP误差只有6%和3%。本文设计的极限功耗测试框架采用一种系统化的方法,不但可以简单、准确、快速地找到不同体系结构GPGPU的极限功耗,而且还可以对新型GPGPU系统进行风险和效率评估,对现代新型GPGPU系统的设计有重要的意义。
其他文献
计算机硬件的发展推动了深度学习技术在图像识别领域的进步,基于卷积神经网络的图像分类,人脸识别方法取得了显著性的成果。近年来,随着人工智能,多媒体等技术的快速发展,监控视频
机会网络是一种在源节点与目的节点之间不总是存在稳定通路,通过网络中节点的随机移动带来的相遇机会进而实现节点间通信的无线自组织网络。这些特性使其被广泛应用在手持设
话题演化是指根据不同时间段文本内部的话题相似度获得的话题产生、兴起、消亡的变化历程。本文实现了基于种子文档和OLDA话题模型的发现文本话题信息的改进方法,该方法使用
社交网络已经变成了许多人的每日生活的必不可少的一部分。许多社交网络已经部署了基于位置的服务。使用这种服务和愈加普遍的能够精确获取地理位置的设备朋友们能够分享最喜
随着智能手机用户数量不断地增加,手机病毒也大量地出现。手机病毒不仅会导致系统瘫痪、泄漏用户的重要信息、远程监控用户,而且也会给人类带来巨大的经济损失。因此智能手机的
随着互联网的发展和智能手机的普及,各种智慧旅游应用在市场上层出不穷,旅游导航系统也成为了智慧旅游建设的主要产品之一。但由于智能手机GPS定位技术在景区导航系统中无法保
随着计算机网络应用的日益深入,计算机终端已成为网络中大部分事件的起点和源头。只有通过完善的终端安全防护才能够真正从源头上控制各种安全事件的发生,遏制网络内部发起的
随着科技的发展,人们的生活越来越趋向于自动化、智能化,信息与物质间的联系日益增强。WSN(Wireless Sensor Network)正是在这发展大潮中诞生的一员,无线传感器网络具有感知
随着高性能计算技术的不断发展,各种高性能计算方法被广泛地应用于实际工程领域,在国民经济、国防建设和科技发展中占有非常重要的战略地位。相场法是目前用于模拟枝晶微观组
伴随多租赁理念在业界的推广应用,基于SaaS模式的应用已经成为一种高效、先进的业务应用解决方案。单实例多租赁(Single Instance Multi-tenancy)的应用模式体现出其低费用,