CNN目标检测系统在嵌入式平台的设计与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:hgs19741022
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉领域的研究热点,在智能交通、智能视频监控、航空航天等诸多领域有非常广阔的应用前景。目前,基于卷积神经网络的目标检测以绝对的优势超过了传统的目标检测算法,但由于卷积神经网络结构复杂、计算量过大,导致其很难在资源不足、功耗低的嵌入式平台实现实时应用。因此,目前工业中常使用激光、雷达等传感器实现目标检测,价格相对高昂。YOLO作为目前性能最佳的实时目标检测模型之一,结构简单、检测速度快,相比其它卷积神经网络模型而言更适合应用到低功耗的嵌入式平台。此外,通过分析GPU、ASIC、FPGA三种芯片在功耗、价格等多方面的优劣,最终选用ARM+FPGA硬件架构的Zynq-7020嵌入式平台设计和实现基于Tiny-YOLO的目标检测系统。本文主要工作包括:1.权衡计算延时和精度损失,提出了8位整型量化推理方案来有效缓解嵌入式平台计算资源和存储资源不足的问题,用整型乘法运算模拟浮点型乘法运算效果,优化激活函数减少量化激活值的时间,并提出相应的量化训练方案降低权重的精度损失,相比浮点型训练与推理,模型大小压缩了75%,计算速度提升2-3倍。2.根据卷积神经网络的结构特征,进行了卷积神经网络计算的软硬件划分,选择在可编程逻辑系统(PL)中设计卷积层和池化层的并行计算IP核,在双核ARM Cortex-A9的处理系统(PS)实现Softmax层和非极大值抑制算法。通过卷积层、池化层并行计算特征和Tiny-YOLO模型的数据量、计算量分析,在Zynq-7020资源限制条件下,设计了嵌入式平台的数据存储、分割、计算方法来完成卷积层和池化层算法的并行加速,相比PS端串行处理,检测速度提高约300倍。3.在Zynq-7020平台构建了目标检测系统的硬件架构,并搭建了目标检测系统的软件运行环境,在上述工作的基础上通过软硬件协同设计,实现了Tiny-YOLO模型的实时目标检测。本文设计立足于嵌入式平台的目标检测系统研究,权衡速度与精确度,最终实现了低成本、高实时性的目标检测系统。在SDSoC开发环境下的硬件仿真表明,片上总功率仅只有2.9W,目标检测速度达到23FPS,达到了实时目标检测的应用需求。
其他文献
1921年6月21日和1929年10月4日,交通大学先后两次致函京校、唐校、沪校,要求各校分别撰制并呈送校徽、校章、校歌、校训。
期刊
本文用高精度的量子力学ab initio方法计算了氦原子与一氧化碳分子相互作用各向异性势能面,通过三重激发校正耦合簇、二次组态相互作用等方法和不同基组的计算结果比较,并采
教育集团化办学不能根本解决义务教育均衡发展问题,内生发展成为义务教育均衡发展的核心路径。优质均衡是新形势下学校内生发展的必然趋势,需要在目标指向、价值追求、发展定
二十一世纪初,我国正处于全面建设小康社会的关键时期,伴随着工业化、城镇化的发展,农村剩余劳动力大量涌向沿海城市或经济发达地区,因此造成农村劳动人数减少、男女比例失调
目的观察过氧化物酶体增殖因子活化受体γ(peroxisome proliferator-activated receptor gammar PPARγ)激动剂罗格列酮(rosiglitazone ROZ)与顺铂(cisplatin DDP)合用对人肺
本报讯嵊州市首届香榧节日前举行,共有20家香榧大户在该市文化广场设摊展销。$$地处会稽山区的嵊州,是我国古香榧树的原产地和主产区。该市有百年以上香榧古树近3万
报纸
绝缘子是高压电线连接塔上挂的一种盘状的绝缘体,作用是增加爬电距离,它使带电部件绝缘,并对其起到机械支撑与定位作用。但是绝缘子长期暴露在户外,大气中的尘埃会沉淀到其表
<正>2016年12月8日,中铝国际工程股份有限公司在北京总部隆重举行了"工程用铝"系列产品合作签字仪式。与国内包括地方政府、大型央企和知名民企在内的多家合作伙伴,成功签订
沂水方言的"子"尾可附着于名词或名词性语素、动词、形容词或形容词性语素、量词、数词、名词或量词的重叠式、动名组合、形名组合、名量组合之后,构成一个名词。部分附着于
台风的路径预报是台风预报的关键。其准确性能直接影响到台风的总体预报效果,反映一个气象机构的台风预报能力。针对各气象机构基于台风路径预报误差的预报效果评估问题,本文