论文部分内容阅读
合成孔径雷达是一种先进的微波对地观测设备,在国民经济和军事应用领域有着十分重要的作用。实时成像算法因为具有实时成像处理能力而在合成孔径雷达系统中具有重要的应用,非线性ChirpScaling(NCS)算法就是其中的一种。实时成像系统通常包括距离压缩、转置存储和方位压缩,矩阵转置在成像算法中起着连接距离压缩和方位压缩的承上启下作用。矩阵转置的效率对整个实时成像系统的性能具有重要的影响。NCS实时成像算法的数据处理主要包含复数运算、FFT/IFFT和矩阵转置3类。本文为满足NCS成像算法的要求,介绍了一款层次化多核处理平台,该平台采用2D mesh的NoC架构,其包含两种用于数据处理的簇结构。其中计算簇用来计算复数运算和FFT/IFFT运算,而转置簇则用来执行矩阵转置运算。本文介绍了这两种簇结构以及该平台所采用的各种协议,并基于该多核处理平台实现了NCS实时成像算法的并行化。矩阵转置是实时成像算法中重要的一部分。由于成像矩阵规模很大以及对转置存储速度的要求,转置存储工作一般用硬件来实现完成。本论文着重讨论一款基于总线SoC架构的转置存储控制器的设计,应用于上述多核处理平台。它使用软硬件协同的方法控制转置存储,具有很好的灵活性以及高速的数据传输速率。同时,选择SRAM作为存储器,控制简单,读写操作容易。该转置存储控制器适用于各种大小的矩阵转置,可灵活地选择转置方法,同时也具有很好的扩展性。本文还基于上述转置存储控制器,实现一种采用数据并行传输的转置方法。进行并行优化后的转置簇增加了一个网络接口,并且使用SRAM的双端口数据传输,实现了数据乒乓操作。同时,利用转置加速单元替换DMA,减少配置单元,实现链路建立自动化,大大缩短建立链路时间。该并行优化转置簇尤其适用于大规模矩阵转置,矩阵转置效率由原来的30%提升到80%。目前这两款转置存储控制器都已嵌入到多核片上网络(NoC)系统中,并基于Xillinx V6550T FPGA芯片实现实时成像原型演示系统。