转置存储控制器的设计及其在多核处理平台中的实现

来源 :南京大学 | 被引量 : 0次 | 上传用户:yuchenyk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
合成孔径雷达是一种先进的微波对地观测设备,在国民经济和军事应用领域有着十分重要的作用。实时成像算法因为具有实时成像处理能力而在合成孔径雷达系统中具有重要的应用,非线性ChirpScaling(NCS)算法就是其中的一种。实时成像系统通常包括距离压缩、转置存储和方位压缩,矩阵转置在成像算法中起着连接距离压缩和方位压缩的承上启下作用。矩阵转置的效率对整个实时成像系统的性能具有重要的影响。NCS实时成像算法的数据处理主要包含复数运算、FFT/IFFT和矩阵转置3类。本文为满足NCS成像算法的要求,介绍了一款层次化多核处理平台,该平台采用2D mesh的NoC架构,其包含两种用于数据处理的簇结构。其中计算簇用来计算复数运算和FFT/IFFT运算,而转置簇则用来执行矩阵转置运算。本文介绍了这两种簇结构以及该平台所采用的各种协议,并基于该多核处理平台实现了NCS实时成像算法的并行化。矩阵转置是实时成像算法中重要的一部分。由于成像矩阵规模很大以及对转置存储速度的要求,转置存储工作一般用硬件来实现完成。本论文着重讨论一款基于总线SoC架构的转置存储控制器的设计,应用于上述多核处理平台。它使用软硬件协同的方法控制转置存储,具有很好的灵活性以及高速的数据传输速率。同时,选择SRAM作为存储器,控制简单,读写操作容易。该转置存储控制器适用于各种大小的矩阵转置,可灵活地选择转置方法,同时也具有很好的扩展性。本文还基于上述转置存储控制器,实现一种采用数据并行传输的转置方法。进行并行优化后的转置簇增加了一个网络接口,并且使用SRAM的双端口数据传输,实现了数据乒乓操作。同时,利用转置加速单元替换DMA,减少配置单元,实现链路建立自动化,大大缩短建立链路时间。该并行优化转置簇尤其适用于大规模矩阵转置,矩阵转置效率由原来的30%提升到80%。目前这两款转置存储控制器都已嵌入到多核片上网络(NoC)系统中,并基于Xillinx V6550T FPGA芯片实现实时成像原型演示系统。
其他文献
学位
学位
学位
多酚氧化酶(EC.1.14.18.1)广泛存在于动物、植物和微生物体内,是一种由核基因编码的含铜金属酶。它是果蔬储藏和加工过程中酶促褐变的重要酶类,能够催化酚类物质的氧化。  以
学位
学位
学位
学位
目前,全球范围内环境重金属污染严重,利用植物修复技术来清除重金属污染是现在研究的热点。对重金属耐性或富集相关基因的功能及作用机理的研究将有助于植物修复技术的发展与应
学位
学位