粗粒度动态可重构处理器中的高能效关键配置技术研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:week11430
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
相比于细粒度的FPGA,粗粒度动态可重构处理器(CGRA)是一种新型的可重构处理器架构。CGRA中的配置信息系统担负着对处理器中的核心模块——可重构处理单元进行配置和控制的任务,因此是整个可重构处理器设计中的重中之重。配置信息系统的设计目标为更低的配置存储、更低的配置延迟和更低的配置功耗。国内外的研究中一直致力于在以上三点取得突破,但并未取得完善的研究成果。本论文针对CGRA的配置信息系统中所面临的配置存储、配置延迟和配置功耗问题,提出了四项高能效配置技术和方法。首先,层次化的配置信息系统顶层设计方法中通过对配置信息进行层次化的组织,降低了配置信息系统的配置存储代价。该方法在加解密算法和H.264解码应用中可分别将配置信息量降低82.8%~93.6%和76.67%。相比于XPP-III可重构处理器中的高配置延迟,该方法可将配置延迟降低为总运行时间的4~13%。其次,阵列的行配置技术中通过以行为单位对阵列进行配置来降低阵列的配置延迟,并消除中间数据的存储代价和子图的配置代价。相比于基于阵列的配置技术,该技术可将阵列在加解密算法和H.264解码应用上的性能分别提升35.9%~42.4%和23.4%,能量效率分别提升16.8%~22.5%和16.7%。再其次,阵列的三维配置信息技术不仅可降低阵列由于完全动态重构所产生的高配置功耗,还可以支持阵列灵活的实现各类互联结构。相比于ADRES可重构处理器内的配置方案,该技术可将阵列配置功耗降低33.78%~43.77%,从而将总功耗降低11.83%~15.55%。最后,多层数据缓存结构及数据传输配置信息设计方法可有效的降低片上数据存储器空间。相比于XPP-III和ADRES,采用该方法,获得单位性能所需的片上数据存储器空间仅为23.8%和14.8%。上述四项配置技术已被应用于两款领域定制可重构处理器和正在应用于一款面向通用应用的可重构处理器的模拟器设计。多媒体可重构处理器REMUS_HPP在200 MHz的频率下可实现H.264格式高清分辨率视频30帧每秒的实时解码,能量效率是XPP-III的15倍。加解密可重构处理器REPROC在400 MHz的工作频率下运行128比特分组的AES算法时,吞吐率可达51.2Gbps,能量效率高于多核处理器架构两个数量级。
其他文献
目的了解巴南区人民医院传染病网络报告质量,促进其工作更加科学、规范。方法按照系统抽样法抽取2005~2009年传染病卡片,分别统计并比较迟报率、漏报率、完整率、准确率及一致
目的:观察微创DHS内固定治疗股骨粗隆间骨折临床疗效。方法:分析我院骨科42例股骨粗隆间骨折,按Evan`s分类法:Ⅱ型10例,Ⅲ型12例,Ⅳ型14例,Ⅴ型6例,均微创DHS内固定术式。结
编辑工作是出版活动的重要组成部分,编辑工作者的职业素养与能力既决定着出版物的质量,更关系到我国社会文化事业的发展.在瞬息万变的信息时代,传播媒体在传播方式、编辑手段
什么是电子监管码?简单来讲,电子监管码是对产品实施电子监管为每件产品赋予的标识,就像是商品的身份证一样.“一件一码”.也可以简称“监管码”。电子监管码的实施有着重要的现实
成形模拟中的多场耦合分析,非线性多尺度耦合分析等问题通常需要对大量数据进行多次计算以得到有效的结果,另外这些计算又必须在合理的时间内完成。本文主要从并行计算架构方
目的:探讨腰硬联合分娩镇痛的临床效果及对产妇和新生儿的影响。方法将160例孕妇按自愿原则分成镇痛组与对照组,各80例。观察两组孕妇的镇痛效果、产程、分娩方式、产后出血及
采用厌氧联产氢气一甲烷工艺研究芦苇能源化利用潜力,解析联产过程中古菌群落特征和演替规律。产气情况表明,芦苇经纤维素酶预处理后累积产气量和氢气、甲烷产量显著提高。聚合