论文部分内容阅读
本文基于采用超长指令字(VeryLongInstructionWord,VLIW)结构和单指令流多数据流(Single-InstructionflowMultiple-Dataflow,SIMD)技术的4发射SuperV处理器,提出了非对称并发多线程微体系结构设计,以促进处理器资源的共享和有效利用,满足视频信号处理的需求。并发多线程(SimultaneousMultiThreading,SMT)结构可以在同一周期向执行部件发射多个线程中的多条指令,通过在时间上和空间上动态调度资源达到灵活的并行效果。但是多线程竞争资源导致单个线程性能降低。非对称SMT结构采用了固定优先级、共享多现场和分配专有部件的方法,使高优先级线程充分享有系统资源,不受其他并发线程的影响,达到理想的前台运行效果。
本文首先描述了SuperV处理器的组织结构和控制通路设计。SuperV处理器采用VLIW结构和SIMD技术,既具有通用微处理器的管理功能,又具有较强数字信号处理能力,其定长短向量运算为视频信号处理提供有效支持。SuperV处理器一次流片成功,通过了MPEG-2解码等测试程序。但要对高分辨率视频信号实时地完成编/解码还需要进一步提升性能。针对视频压缩的数据流密集型和计算密集型特点,本文采用SMT结构对SuperV处理器的吞吐率进行优化。
通过对SMT结构设计复杂度的权衡,本文提出了基于SuperV处理器的非对称SMT结构及其实现方案,完成了线程选择部件的寄存器传输级设计,并为多现场扩展进行了多端口寄存器堆的全定制物理设计。另外,本文还基于SuperV指令集提出了线程管理指令扩展方案,能够支持可阻塞多线程计算模型;以及针对MPEG编码程序的线程调度策略,保持了视频编码程序中数据和程序的局部性,且易于达到硬件线程的负载平衡。实验结果表明,4线程非对称并发结构能够将SuperV处理器的单周期平均执行指令数提高到3倍以上,其面积仅增加34﹪,而功耗有效性(每秒钟执行指令数与功耗的比值)提高到原来的1.56倍。基于SuperV处理器实现的非对称并发多线程结构,除了能够更好地支持视频信号处理之外,其应用领域将扩大到网络服务、数据库、多媒体处理和个人电脑等更多方面。