可配置专用处理核若干模块设计与建模

来源 :南京大学 | 被引量 : 0次 | 上传用户:fang82888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
软硬件协同技术是当今SoC系统开发领域的研究热点,它通过建立系统模型进行系统的顶层设计,划分软硬件,进行系统级的协同仿真、综合与验证,将软件与硬件的研发并行化。这种技术能够加快系统软件和硬件的研发,降低错误率,缩短研发时间,节约成本。本文调研了软硬件协同设计的方法与步骤,设计了一种可配置专用处理核的事务级系统模型,并介绍了其建模语言、建模对象、运行方式、主要模块。该模型是基于SystemC的事务级模型,通过在功能模块中加入时序信息,实现周期精确级的建模。本论文主要研究FFT、排序两种算法模型的实现以及排序算法在算法模型基础上的硬件实现。首先基于硬件资源和算法要求,建立了参数化可配置的FFT算法周期精确模型,并且基于模型研究了 FFT算法模型的几种硬件实现架构。并选择了基2+基4+基8的四路并行的实现方案,在控制模块的配合下实现了调试模式、较大/小运算点数乒乓操作。然后基于硬件的存储结构和硬件资源,建立了参数化可配置的排序算法周期精确模型,基于模型和算法特征,选择2个单精度浮点数加法器并行的2路归并排序作为最终的实现方案,实现了排序的硬件加速模块。仿真与验证部分中,介绍了软硬件协同仿真调试的流程、方法,给出相应的测试结果。在仿真中,周期精确模型与硬件设计的周期数相同,达到了周期精确的设计效果,在计算65536点时模型仿真时间比硬件仿真快30倍,计算524288点时快72倍,体现了软硬件协同设计的优势。排序硬件加速模块实现了 128k点以内单精度浮点数的并行排序,仿真中工作在123.6MHz的主频下,2048点的运算时间在330 μ s以内,16000点的运算时间在2800 μs以内,并给出了部分关键模块的仿真波形图和测试结果,结果完全符合指标的时间要求。
其他文献
在当今社会,伴随着社交网络、物联网、互联网等技术的普及,全球数据信息正以指数级的速度爆炸性增长。而数据的存储量也由TB、PB到EB、ZB甚至YB不断扩大。然而,在人们的生活
精密单点定位(Precise Point Positioning,PPP)是一种高精度的单点定位技术,自从1997年Zumbeger等人提出精密单点定位技术,国内外许多专家学者从模型以及算法等多方面进行了
在科学研究和工程领域中许多问题都是由多个相互冲突的目标组成,一般称这一类问题为多目标优化问题。基于种群的进化算法在单次运行中能得到一个近似的Pareto解集,因此多目标
近年来,幻构人脸技术作为图像超分辨率(Super-Resolution,SR)的分支,受到了人脸图像邻域研究学者的重点关注。幻构人脸技术通过挖掘低分辨率(Low-Resolution,LR)人脸图像中的
图像识别在自动驾驶、医疗诊断等许多领域有着广泛的应用,而图像分割的结果将会在很大程度上影响到图像识别的准确性和正确性。之前对于图像分割的研究主要集中在对灰度图像
传统的无线多媒体传感器网络(WMSN)节点仅配备一路摄像机,图像感知区域有限,无法在同一时间实现全向的观测。由多个WMSN节点组成的观测网络,又存在覆盖失衡、数据传输冗余等
集成电路(IC)工艺和设计方法的提高,在单个芯片上集成多个芯片实现更为复杂的功能成为可能,系统芯片(SOC)集成技术在这种背景下应运而生。SOC的实现是采用知识产权(IP)核复用
随着卷积神经网络的发展,以及硬件技术的进步和大数据时代的到来,物体检测技术不仅检测率得到大幅提升,而且检测速度也极大加快。这使得物体检测在一些要求实时检测的系统中
复数值前向神经网络因其强大的计算能力与和良好的泛化性能等优点,在众多领域得到了广泛的应用。在具体的网络结构设计过程中,激励函数需要满足有界性和可导性。但是根据刘维
目前,软件应用十分广泛,在软件开发的前期检测出错误的代价比后期发现并修改的代价要低。传统的基于模型的测试方法存在两方面的弊端,一是手工建模,模型的正确性不易保证,二