论文部分内容阅读
VLSI技术的迅猛发展和计算密集型应用的不断涌现,驱动计算机体系结构不断革新,高性能可扩展的并行体系结构成为学术界和工业界关注的焦点。流体系结构以结构简单、芯片资源利用率高、并行计算能力强、可扩展性好等显著优势,逐渐成为未来并行体系结构的一个重要分支。新兴流处理器如Imagine、Merrimac、FT64、MASA、Cell、NVIDIA G80、Storm DSP、Tiles64等,都得到了广泛的关注。随着对流体系结构研究的不断深入,一些新的问题不断产生,如流体系结构片上指令存储器利用率不高、单一的SIMD执行模式对流应用领域的限制、流体系结构不断扩展带来的仿真成本和仿真速度之间的矛盾等问题。在这样的背景下,作者选择了“流体系结构指令管理及系统虚拟化仿真技术研究”作为论文课题。本文对流体系结构进行了深入系统的研究,研究的内容涉及kernel指令码分析、指令存储器设计、流体系结构执行模式、基于FPGA的流体系结构仿真系统优化等关键领域。本文的工作和创新主要体现在:1.提出了一种提高流体系结构片上指令存储器利用率的解决方案——基于kernel热代码管理的指令存储器。本文建立了Kernel-SPM模型,从kernel特征分析出发,定义了kernel热代码,并提出了kernel热代码定理和kernel热代码的查找方法。根据kernel热代码的特征,本文提出了kernel热代码和kernel凉代码分别管理的kernel指令管理策略,并构建了基于kernel热代码优化的软件管理指令存储器和软硬件混合管理指令存储器。实验表明,在合适的配置下,两种存储结构都能有效的降低片上指令存储器的面积开销,且对程序的性能影响较小。2.提出了VLIW分域压缩技术,设计并实现了流体系结构全分布式指令存储器。本文首先通过对一系列典型流应用的测试分析,量化了VLIW各子域的空操作比例。针对于流应用中VLIW稀疏问题,提出了VLIW分域压缩技术,设计了流体系结构全分布式指令存储器,并提出了流体系结构SIMD流水执行模式。实验证明,分域压缩技术与全分布式指令存储器结合,能有效的减少流体系结构中指令码对片上指令存储空间和存储带宽的需求。3.提出了流处理器多态技术,并完成了流体系结构SIMD流水态、MIMD态和分布式流寄存器文件的设计实现。本文首先分析了SIMD执行模式对流体系结构应用领域扩展的限制,然后针对于流应用中流呈现出的多态性,提出了多态流体系结构,扩展了经典流体系结构中单一的SIMD执行模式,引入了SIMD流水态和MIMD态,设计了相应的分布式流寄存器文件,并研究了多态流体系结构编程接口等问题。实验表明,多态流体系结构不仅兼容了经典流体系结构的执行模式,而且能更好满足新型流应用的需求。4.提出了系统虚拟化仿真技术,设计并实现了MASA流体系结构虚拟仿真平台。本文提出了系统虚拟化仿真模型,包括虚拟计算页仿真模型、存储页旋转模型以及簇内功能配置模型,并提出了虚拟仿真系统的设计方法。本文构建并分析了MASA流体系结构虚拟仿真平台,实验表明,系统虚拟化仿真模型能有效的降低流处理器仿真系统对FPGA资源的需求,且其带来的仿真时间增量是可接受的。另外,本文进一步扩展了系统虚拟化仿真模型,提出了适用于SIMD体系结构的多频时钟耦合虚拟仿真技术和对称多核体系结构虚拟仿真模型。实验表明,系统虚拟化仿真技术不仅适用于流体系结构,而且能在SIMD、对称多核等对称体系结构仿真中有效的减少仿真系统资源消耗,增大可仿真系统的规模。