基于Zynq的点云神经网络加速器设计

来源 :深圳大学 | 被引量 : 1次 | 上传用户:lianxirenll520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着大数据时代的到来,卷积神经网络逐渐的替代了传统的识别方法,为了获得更强的特征,实现更高的精度,网络也从2D发展至3D。网络的结构变得日渐复杂,对硬件的计算能力要求便越来越高。虽然现在用于运行网络的CPU与GPU能满足某些应用的需求,但在识别速度快、能耗要求高、环境复杂的场景下,CPU与GPU就明显不适用了。FPGA具有高度并行、可配置和低功耗等特点,在FPGA上运行诸如卷积神经网络这种高度并行网络具有广泛的应用前景。本文选取了一种轻量级的点云神经网络(Pointnet)作为研究的基础架构,该网络是一种三维并能用于直接处理点云数据的神经网络。通过分析该网络的时空复杂度,在不影响训练精度的情况下,对该网络进行优化(O-Pointnet),并且通过添加批量归一化的方式来增加网络的非线性,而不是采用添加偏置的方式,以便达到更快的运算速度同时减少内存的负担。此外,本文通过FPGA对点云神经网络进行加速。采用“主机+FPGA”的计算架构,FPGA用来对点云神经网络的前向传播部分做硬件加速,主机用来对训练好的特征做分类。通过分析点云神经网络的并行性与FPGA内部资源情况,设计其前向传播的硬件结构。通过时序控制,来实现不同卷积的复用与启动。本文的设计在Zynq系列的xc7z045平台上实现,整个系统采用部分流水的方式,采用16bit定点数进行运算,处理一张大小为640×480的深度图,其速度为0.279s,即FPS=3.58images/s,功耗仅为2.1W。实验表明,本文的设计,速度相比于CPU提高了约8.4倍,相比于GPU提高了约6.6倍,同时功耗小于CPU与GPU的功耗,进一步验证了本文的设计达到了快速度、低功耗的基本目的。
其他文献
随着区域交流和社会经济的快速发展,道路交通运输量迅猛增长,越来越多的道路已经不能满足如今交通量的需求。利用现有老路,将其进行加宽加铺改造已经越来越普遍,对于高路堤加
经典Pawlak粗糙集理论是处理模糊性及不确定性知识的数学工具,在众多领域受到广泛关注,但是其缺乏一定的容错性,而决策粗糙集模型和程度粗糙集模型作为经典Pawlak粗糙集模型
孔雀石是主要的氧化铜矿物,在硫化浮选过程中,硫化钠用量的控制是一个至关重要的因素,一旦过量便会对其浮选造成抑制,从而影响其浮选效果。本论文是针对孔雀石在硫化浮选过程
随着汽车电子行业的发展,车载娱乐设备也变得越来越智能化,在驾驶员使用这些设备的同时,对于安全驾驶也提出更高的要求,其中在人机交互系统中衍生出一种可以脱离传统需要人机
在高纬度、高海拔的寒冷地区,混凝土结构普遍存在冻融破坏现象,冻融损伤不仅降低混凝土结构的力学性能,而且缩短其使用寿命,甚至对人民生命财产安全造成极大的威胁,因此必须
利用NCC具有高比面积、独特光学性质、层状排列的手性向列型液晶相为模板剂,诱导自组装制备出CNMS材料,CNMS将左手螺旋层状结构和液晶特性等精确地复制在其中。由于CNMS较大
受人类视网膜工作机制的启发,动态视觉传感器(Dynamic Vision Sensor,DVS)由于其有诸多优于传统的基于帧的图像传感器的某些优势,近来已成为研究热点。DVS中的像素不是在积分
目前,肺癌已经成为世界上发病率和死亡率最高的疾病。患者一旦被确诊为肺癌,往往已经处于肺癌晚期,晚期肺癌患者的五年存活率很低。因此,对肺癌患者做到早发现、早诊断、早治
3D打印技术又称增材制造技术,近年来获得了迅速发展。激光选区熔融技术(Selective Laser Melting,SLM)是技术较成熟、应用较广泛的一种3D打印技术,可制造致密度高、组织良好
软件开发过程中,诸如代码、需求文档、测试集合等软件制品之间的追踪线索对于软件理解、影响分析、软件维护等活动都具有重要意义。然而,人工的建立软件制品之间的追踪线索需