【摘 要】
:
近年深度学习在视觉领域的突破性进展使其研究异常火热,尤以卷积神经网络为代表的算法模型不断推陈出新。然而,算法模型的计算量增加,使得如何实现算法加速成为亟待解决的问题。当前深度学习算法主流部署平台都有一定缺陷,CPU运算速度缓慢,GPU功耗高,专用集成电路(Application Specific Integrated Circuit,ASIC)不易更改网络模型,导致硬件平台难以兼顾实时性与经济性,
论文部分内容阅读
近年深度学习在视觉领域的突破性进展使其研究异常火热,尤以卷积神经网络为代表的算法模型不断推陈出新。然而,算法模型的计算量增加,使得如何实现算法加速成为亟待解决的问题。当前深度学习算法主流部署平台都有一定缺陷,CPU运算速度缓慢,GPU功耗高,专用集成电路(Application Specific Integrated Circuit,ASIC)不易更改网络模型,导致硬件平台难以兼顾实时性与经济性,相反FPGA的并行计算能力较好、功耗低和资源丰富,更适合用于卷积神经网络(Convolutional Neural Networks,CNN)加速。目前在水果的后期加工环节,传统通过机械式分级机对采摘后的水果进行分类,同时根据其外部品质优劣进行分级处理的方法存在精度低和速度慢的问题。论文为此提出了一种基于深度学习的水果外部品质分级的算法,同时将其部署在现场可编程门阵列(Field Programmable Gate Array,FPGA),实现算法加速,无需人工参与,即可获得较高的识别率和工作效率。论文主要工作如下:(1)为提高水果分级的效果,论文采用轻量化卷积神经网络Mobile Net V2算法来提高识别速度和准确性。通过修改全连接网络层和增加注意力机制,对Mobile Net V2算法进行适应性改进。利用自制的数据集,对改进后的算法进行了验证。实验证明:改进后的Mobile Net V2算法准确率提高了1.95%。(2)为提高卷积神经网络的运算速度,论文采用Xilinx公司的ZCU104作为开发平台,对预处理和改进后Mobile Net V2算法进行硬件加速处理。根据其ARM+FPGA的架构,将FPGA的算法实现分为可编程逻辑(Programmable Logic,PL)和处理器系统(Process System,PS)两个部分。首先在PL侧实现了均值滤波与双线性差值缩放,然后对Mobile Net V2的卷积函数进行了并行优化,通过双通道卷积和对输入特征图通道方向得到的数据进行并行计算,提高模块执行的效率,并在其内部设计了并行批量归一化(Batch Normalization,BN)模块,同时设计了高并行的流式池化模块。另外,还对激活函数Softmax函数进行了多次分段查表的改进。在PS侧实现Mobile Net V2的网络重建以及反向残差层的数据流调度。实验证明:在CPU、GPU和FPGA平台的准确率相差不大的情况下,FPGA并行化算法的运行速度是CPU的6.8倍并略高于GPU。
其他文献
在当今储能领域中,锂离子电池占据主导地位。但目前商业锂离子电池的发展正面临瓶颈,受到安全风险的限制,如低沸点有机液态电解质导致的泄漏、燃烧甚至爆炸。采用固态电解质是解决安全问题的一种最有效的策略。其中,聚合物固态电解质因其具有低易燃性,良好的柔韧性,优异的热稳定性和高安全性等优点成为重要的技术方向之一。但是,聚合物固态电解质的室温离子电导率低和界面接触差仍然是其商业化发展的主要挑战。本文针对上述问
作为典型的轻量化材料,镁合金在诸多应用领域都是理想的工业材料。但是,镁合金耐蚀性差是限制其作为结构材料规模化应用的关键障碍。激光冲击强化(Laser shockpeening,简称 LSP)和表面磷化(Surface phosphate conversion,简称SPC)是提高镁合金耐腐性能的两种有效的表面处理方法,随着工业化的进步,复杂极端的服役环境对结构材料提出了更高的要求,单一的表面处理技术
车灯技术伴随着需求的多样化和科技的驱动不断发展,形态及功能也日趋细化。光导作为车灯的增亮部件尤为关键,可以保证发光的均匀,增强车灯明亮度,广泛应用于汽车雾灯、昼行灯和尾灯等车灯中。针对光导塑件容易出现翘曲与收缩的现象,本文以厚度约10mm,最大外形尺寸约150mm×215mm×200mm的某汽车前组合灯条状透明PC光导为研究对象。从原材料、注塑机、模具和成型方式四个方面介绍了光导成型技术,并从多点
随着气候问题的变化和经济发展的需要,践行绿色低碳行为的理念日益深入人心。为合理估算新形势下的碳社会成本,更好地制定相关碳政策,本文主要研究了以下两方面内容:(1)基于人们践行绿色行为的视角,从经济、效用、气候三个模块构建新型碳社会成本模型,研究不同气候状态下的最佳碳社会成本。经济模块中构建了绿色行为产出量以刻画绿色行为产生的价值,对于其他各函数的设置和函数间的相互影响考虑的更加全面。效用模块中除了
随着我国机动车保有量快速增长以及交通运输行业的快速发展,道路交通事故造成的财产损失和人员伤亡给人们的正常生活带来巨大影响。如何有效减少交通事故,提高道路交通安全成为一大难题。在道路交通系统中,驾驶人是主体,驾驶人的行为与道路交通安全关系密切;在相同的道路交通环境下,不同驾驶人的驾驶习惯存在较大差异性,所面临的事故风险也各不相同。因此,分析不同驾驶人的行为特性,构建评估指标体系对驾驶人行为的安全性进
行星耦合混合动力传动系统(Planetary Coupling Hybrid Transmission,PCHT)作为新能源汽车特别是混合动力汽车(Plug-in Hybrid Electric Vehicle,PHEV)常用的核心部件,能够为车辆提供灵活的动力耦合方式、紧凑的结构布置和高效的传动效率,从而得到了广泛的应用。然而,其复杂结构为模式切换品质带来了诸多挑战,深入研究行星耦合系统扭振特性
针对现有天车式除锈设备结构庞大难以运输、以及爬壁式除锈设备承载能力差且不能处理复杂表面的问题,本课题组基于Stewart并联结构独创研制了一种桥梁钢箱梁喷砂除锈并联机器人,它由并联操作机构、升降机构和移动平台等构成,具有刚度高、承载能力强、可移动性好的优点,能够实现任意移动、自由升降、六自由度位姿精准运动操作等。其中,移动平台为8轮式结构,具有结构稳定、转向便捷等优点。钢箱梁喷砂除锈操作现场为低附
随着能源革命和新材料、新一代信息技术的不断突破,汽车产品加快向新能源、轻量化、智能和网联的方向发展。汽车电子水泵是伴随汽车产业技术发展和市场需求催生的高技术产品,属于微型高速离心泵,具有转速变化范围大、几何结构复杂、运行环境温度高等特点,运行时较易发生空化,进而造成性能下降,引起剧烈的振动及噪声,严重时甚至会造成过流部件损伤,影响交通安全。空化是一种涉及复杂相变的多相流动现象,空化的多尺度时空溃变
交通标志的作用是向驾驶员提供准确的道路信息,保障道路的顺畅通行。交通标志检测是智能车辆辅助驾驶和自动驾驶的重要环节,因为交通标志的类别各不相同,并且在检测过程中可能会出现多目标重叠、遮挡等情况,所以如何精确、高效的检测交通标志是一个挑战。目标检测方法可以分为传统方法和基于深度学习的方法,传统方法先手工提取特征再进行模板匹配,存在着检测准确率低、实时性差等问题。基于深度学习的方法往往在有不错的检测精
随着化石能源的枯竭和污染对人类社会的影响日益严重,利用光催化技术将生物质平台化合物转化为高附加值化学品具有重要的现实意义。本文从可持续发展的角度出发,利用光催化技术将5-羟甲基糠醛(HMF)高选择性转化为2,5-二甲酰基呋喃(DFF),并研究了硫化镉量子点(CdS QDs)、硫化镉量子点/还原氧化石墨烯(CdS QDs/rGO)、硫化镉量子点/壳聚糖碳(CdS QDs/Ch)等一系列用于HMF氧化