【摘 要】
:
粗粒度可重构架构(Coarse-Grained Reconfigurable Architecture,CGRA)是近年来兴起的一种兼具灵活性和高能效的领域专用处理架构,一定程度上填补了专用集成电路和通用处理器
论文部分内容阅读
粗粒度可重构架构(Coarse-Grained Reconfigurable Architecture,CGRA)是近年来兴起的一种兼具灵活性和高能效的领域专用处理架构,一定程度上填补了专用集成电路和通用处理器之间的空白。然而,CGRA受限于数据流驱动特性,对于大量应用场景中出现的if-then-else(ITE)和nested if-then-else(NITE)型控制流无法高效处理。而基于状态的完全条件执行(State-based Full Predication,SFP)策略,作为一种主流解决方法,虽然可以实现ITE和NITE的基本功能,但仍存在由状态寄存器改写等冗余操作所导致的处理性能低的问题。本文设计了一种基于标签的完全条件执行策略(Tag-based Full Predication,TFP),将伪分支SFP(PSFP)中基于标签的唤醒机制拓展并应用于操作无效化。TFP策略相对于现存策略的改进之处不仅在于以标签异同决定操作执行与否,而且在于采用分布式操作无效化和并行化标签改写机制,消除了传统SFP中因集中式状态转移而引入的串行冗余操作。此外在功耗优化方面,本文利用现有门控时钟方法,通过减少操作无效化时计算单元的寄存器的翻转,降低动态功耗。本文对所改进的方案进行了硬件架构设计和FPGA综合实现,并分别对基于伪分支和计数器唤醒(CSFP)的两种SFP方案进行了RTL复现。本文从Mibench和SPEC CPU2006基准测试集中,提取了具有ITE和NITE结构的循环程序段作为负载应用,并手工映射至CGRA硬件架构。通过比对Vivado环境中的RTL级仿真结果与C程序运行结果,本文对架构设计的功能正确性进行了验证,并在此基础上分别对性能和功耗进行了对比评估。实验结果表明,相比于传统PSFP和CSFP方法,本方案性能提升30%以上,功耗开销增加10%以内。冗余操作的消除直接带来了性能的提升。
其他文献
随着航天事业的飞速发展,未来的空间任务量级急剧增加,复杂且不可预知的空间任务场景对空间操控装置的可靠性提出了更高的要求。空间细胞机器人是一种具有高度的自主性和环境
非线性方程组求根问题是数学和工程计算领域中的基本问题之一,在计算机图形学、计算机辅助设计和科学计算等领域有着非常广泛的应用。比如图形学中的碰撞检测、流体模拟、光
压缩感知(CS)理论利用信号的稀疏性,通过观测矩阵以远低于Nyquist的采样频率对信号进行采样,并利用重构算法能够从少量的观测数据中准确重构出原始信号。该理论的提出突破了N
随着外延技术和结构设计不断的进步与突破,硅衬底InGaN基LED采用InGaN/GaN多量子阱(MQWs)作为有源区理论上可以覆盖从近紫外到近红外的宽光谱区,使其在固态照明中非常具有吸
《国际体育史杂志》的英文名称是The International Journal of the History of Sport,其前身是《英国体育史杂志》(British Journal of Sports History),1984年由托尼·曼根
高功率窄线宽光纤激光放大器在相干合成、光谱合成、引力波探测、非线性频率转换等诸多领域有着广泛应用。然而此光源输出功率提升的首要受限因素是受激布里渊散射效应。本文
纳米纤维(NFs)由于其独特的形貌结构,具有大比表面积、固定电子传输路径等优点,被广泛应用于光电、储能、电子等领域。静电纺丝技术由于在生产过程中不需要复杂的生产环境、可
在目前这样一个科学和技术不断更新的社会中,终生学习是适应社会发展和实现个体发展所不可缺少的能力。所以学习能力、总结能力、反思能力显得尤为重要。同时,《高中生物课程
具有1,5–二烯骨架的化合物普遍存在于大量生物活性分子和药物分子中,在生物活性方面起着不可或缺的作用,例如杀虫剂milbemycinβ3,抗生素rottnestol和富马酸还原酶抑制剂naf
吡咯及其多取代衍生物是一类重要五元杂环,单独或做为核心骨架存在于很多产物结构中,部分具有很好的抗炎、抗菌、抗病毒、EP1受体拮抗剂、安定和抗痉挛、抗癌活性等生物活性