一种基于关键路径分析的CPU-GPU异构系统综合能耗优化方法

来源 :计算机学报 | 被引量 : 33次 | 上传用户:pwd19881217
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
GPU强大的计算性能使得CPU-GPU异构体系结构成为高性能计算领域热点研究方向.虽然GPU的性能/功耗比较高,但在构建大规模计算系统时,功耗问题仍然是限制系统运行的关键因素之一.现在已有的针对GPU的功耗优化研究主要关注如何降低GPU本身的功耗,而没有将CPU和GPU作为一个整体进行综合考虑.文中深入分析了CUDA程序在CPU-GPU异构系统上的运行特点,归纳其中的任务依赖关系,给出了使用AOV网表示程序执行过程的方法,并在此基础上分析程序运行的关键路径,找出程序中可以进行能耗优化的部分,并求解相
其他文献
随着对MD5和SHA1攻击方法的提出,美国国家标准技术研究所(NIST)组织启动了SHA-3的征集计划,目前已进入第3轮.BLAKE算法进入了最后一轮竞赛,文中首先综述了BLAKE算法从提交到目
随着电力企业节能减排工作的快速发展,节能减排在线监测系统已成为省级电网信息系统中的重要组成部分。节能减排在线监测系统主要包括机组数据实时监测、在线煤耗指标计算、
随着无线射频识别等监控技术的发展,事件流上的复杂事件处理技术得到了广泛的关注.现有的事件流处理技术主要提供尽最大努力(Best-Effort)式的服务来减少平均响应时间,这种方式
IEEE 1588v2时间同步技术能达到亚微秒级同步精度。文章在对OTN和PTN进行同步技术分析的基础上,基于OTN+PTN统一同步网络组网模型的应用场景,提出了1588v2时钟信号在混合网络
在P2P网络中,基于衰落Bloom Filter的弱状态路由算法试图将每条查询消息沿着成员资格信息量最强的方向传递,并最终以较低的传输代价和传输时延确保较高的查准率.研究发现衰落
文中针对无约束环境下现实人体行为识别的难点问题,提出了一种自适应特征融合算法.首先,通过图像特征点跟踪和背景轨迹剪除,获得可靠的特征点轨迹,并从中计算得到一组丰富的动作描述符,以同时保留轨迹的局部运动信息、形状以及静态外观信息;然后,采用词袋(Bag of Words,BOW)模型,将视频序列表示为视觉词语频率直方图;最后,为应对摄像头移动和静止情况下,视频中动作特点的剧烈变化,提出自适应的特征融
TD-LTE系统是当前主流的新一代宽带无线通信系统,文章介绍了TD-LTE系统在智能配电网通信中应用的测试情况,重点介绍了TD-LTE系统的覆盖、业务容量、时延丢包、终端移动性等关
组合测试是软件测试数据生成研究的一个重要领域,其中参数配对组合测试的应用最为广泛.对常用的参数配对组合覆盖方法进行了综述分析.目前主流的配对覆盖算法AETG和IPO所存在的