基于AltiVec技术的浮点类指令的硬件设计与实现

来源 :天津大学 | 被引量 : 0次 | 上传用户:wy85396021
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为提高嵌入式设备对多媒体应用的处理能力,多家处理器厂商都在其主处理器上增加SIMD协处理器指令子集。AltiVec就是PowerPC处理器的SIMD协处理器指令子集,用于提升PowerPC处理器的数据级并行处理能力。相比较于传统的PC设备,嵌入式设备对面积和功耗的需求更为苛刻,如何在速度、面积、功耗这三者进行折中就成为AltiVec的设计重点所在。向量浮点功能单元是AltiVec指令中重要的指令子集,其性能、面积和功耗直接决定了整个AltiVec的设计优劣。本文提出了一个可流水、四周期的向量浮点功能单元,该浮点功能单元以MAF为核心数据通路,整个MAF分为四个执行阶段:乘法阶段、加法阶段、规格化阶段和舍入阶段。其他大部分的指令会复用该MAF数据通路,保证性能的前提下尽可能的减少了面积开销。在面积和功耗方面,采取了两级面积复用策略来减少整个向量浮点功能单元的面积。通过两级面积复用策略,在保证向量浮点功能单元可流水的前提下,最大程度的减少了面积开销,功耗也随之降低。在功能单元的验证上,采用SystemVerilog验证平台对功能单元进行验证,确保每条指令的功能准确无误。最后,采用DesignCompiler,基于SMIC 0.13um工艺对功能单元进行综合,相比于未进行两级面积复用策略的方法相比,在速度相差不到3%的情况下,面积节省了24%。在顶层通路的设计中,AltiVec通过APU接口接收来自PowerPC主核的指令,译码时产生功能单元的片选信号,同时在译码时进行指令相关性检测、旁路控制检测。一个周期读操作数,若干周期执行,一个周期写回。AltiVec有独立的向量寄存器堆,向量寄存器堆中有32个128-bit的向量寄存器,三个读端口保证了同时可以读取三个向量操作数,五个写端口保证了峰值情况下可同时写回五个向量结果。
其他文献
在高性能数字系统中,锁相环被广泛地用于产生高性能的片上时钟。任何时序抖动,或者相位噪声都将严重降低系统的性能,特别是随着系统工作频率增加,这种影响更加明显。因此,高性能锁
铁路信息化是铁路现代化的主要标志。近年来为了加快铁路信息化建设的步伐,促进铁路现代化发展,提高铁路的竞争能力,我国引进了GSM-R铁路移动通信系统。机车综合通信设备作为
本文在对两阶串并组合开关电容(SC)DC-DC变换器的拓扑结构及工作原理进行简单分析的基础上,以采用CMOS工艺设计的一个12V-5V SC DC-DC变换器为例,提出了用易于实现单片集成的并联CMOS方法提高单片集成DC-DC变换器输出功率的方法。研究表明,采用互补并联比直接并联更容易提高变换器单元电路的输出电流,并且电路所需要的滤波电容较小。为了进一步提高输出电流,利用CMOS电路易于并联的特