【摘 要】
:
模型压缩是当前深度学习技术从实验到实际落地部署的一个重要环节,涉及到的主要方法包括轻量化模型设计、低秩分解、剪枝、量化和知识蒸馏等,随着深度学习的广泛应用,模型压缩技术逐渐成为该领域的研究热点之一。本文重点对面向图像数据的目标检测问题进行模型压缩研究,一方面,图像信息的维度较高,在进行网络推理时需要巨大的参数量和浮点运算量;另一方面,相比于图像分类问题,目标检测的应用范围更加广泛,问题更加复杂,因
论文部分内容阅读
模型压缩是当前深度学习技术从实验到实际落地部署的一个重要环节,涉及到的主要方法包括轻量化模型设计、低秩分解、剪枝、量化和知识蒸馏等,随着深度学习的广泛应用,模型压缩技术逐渐成为该领域的研究热点之一。本文重点对面向图像数据的目标检测问题进行模型压缩研究,一方面,图像信息的维度较高,在进行网络推理时需要巨大的参数量和浮点运算量;另一方面,相比于图像分类问题,目标检测的应用范围更加广泛,问题更加复杂,因此对其进行研究具有重要意义。首先,改进了基于残差模块的批归一化剪枝算法。考虑到多个残差模块不同层之间的通道限制,使用Group Lasso正则化对多个有联系的层的对应通道同时稀疏化,从而保持剪枝后结构对齐;以往的批归一化剪枝过程并未考虑偏置项的影响从而导致剪枝前后性能存在较大差异,本文通过推导将剪枝后的偏置项融入到其他层当中,从而提升剪枝的效果。实验表明,针对两种不同特点的网络,两种改进分别起到了显著的效果。其次,将剪枝前后的模型分别作为教师网络和学生网络进行蒸馏,弥补因剪枝带来的模型精度损失。由于教师网络和学生网络模型容量的差异,且教师网络中的部分预测错误会对学生网络造成困扰,因此希望将最有用的关键信息传递给学生网络。基于上述问题,本文提出了基于中间特征的关键信息蒸馏和基于网络输出的关键信息蒸馏,提取教师网络中最关键的信息,传递给学生网络。实验表明,这种方法可以显著改善蒸馏效果,使学生网络的精度接近甚至超过教师网络。最后,基于以上剪枝和蒸馏获得的模型,进行量化和部署,在NVIDIA GPU和ARM两种不同的硬件平台上测试检测精度和推理时间,并将剪枝前后、不同量化位数、不同硬件平台上的模型推理时间进行对比分析。实验发现,网络能够在精度无损的情况下部署到两种硬件上,且本文的剪枝、蒸馏和量化算法流程在保证模型精度的同时对于模型推理速度有显著的提升。
其他文献
心脏CT医学影像用于临床诊断心脑血管疾病具有重要意义。使用计算机断层扫描(CT)或其他成像技术获得精确的全心分割在心脑血管疾病的治疗中起着重要的作用。由于医生手动分割在面对海量医学图像数据时比较低效,因此借助深度学习技术中的神经网络通过多次学习图像特征,能够快速、准确的完成心脏自动分割任务具有重大意义。本课题将心脏CT图像分割算法作为研究对象,基于经典分割网络3D Unet提出一种新的3D深度监督
高维多目标优化问题是指同时优化三个以上目标的问题,广泛存在于实际应用中。演化算法拥有良好的全局搜索能力,在目标维数较低时有较好的求解性能。目标数量增多时,搜索空间变大,演化算法在求解过程中难以兼顾收敛性和多样性,导致求解效果不佳。因此,设计具有良好求解效果的高维多目标演化算法具有重要意义。环境选择是演化算法的重要组成部分,作用是选择适应度较好的个体参与演化。设计合适的环境选择策略可以平衡种群在演化
鱼雷具有隐蔽性高、射程远、威力大等优点,一直是海军装备中的核心武器。常规鱼雷发射速度约30m/s,在入水过程中可能出现器件失灵、跳弹和沉底等现象。目标检测与跟踪技术可以提供弹体姿态、位置、速度等信息,是支撑鱼雷入水稳定性研究的基础数据,因此设计高精度弹体检测与跟踪算法具有重要意义。传统的弹体位置数据是通过相机软件人工标记或传感器检测得到,实时性差且成本高。随着计算机视觉的发展,目标检测与跟踪技术为
随着信息技术的高速发展,我们在享受互联网带来的便利时,也需要应对信息使用效率低的难题。面对海量的信息,性能良好的个性化推荐算法可以让用户快速找到自己感兴趣的内容,为企业带来巨大的经济效益。推荐系统数据集是基于用户的点击行为所收集的数据。在点击数据的采集过程中,由于误触、被夸张的标题或者图片吸引产生了大量的“假数据”,限制了模型的推荐效果。实际应用中能够采集到的用户行为数据是有限的,基于协同过滤的推
随着大数据时代的不断发展,数字化、信息化已经成为国民经济发展的重要增长点,国企作为国民经济的支柱产业,已经随着时代浪潮逐步进入深化改革、不断演化发展的进程,国企管理升级的举措也日渐与国际接轨,财务部门作为管理机构也逐步实现了“六者定位”的转变,但单一传统的账表分析及呈现方式已不能满足当下管理层对转型后财务管理工作的要求。Tableau作为一款多功能快速分析、可视化并能分享信息的软件,它能生动地帮助
目标跟踪是实现智能化视频应用和智能决策的关键环节,对视频监控、智能交通、和人机交互中的运动捕获等应用都具有重要意义。但是在各类应用场景的长视频中,目标存在表观变化和反复遮挡,如何持久稳定地跟踪目标成为了亟待解决的问题。本文针对自然场景下长视频的目标稳定跟踪问题进行研究,主要的工作如下。(1)针对长视频中跟踪目标表观变化和遮挡后重捕获问题,设计了一种基于标注帧特征融合的目标跟踪方法。该方法采用基于检
对于我们人类而言,拥有着复杂结构以及丰富细节等特点的人脸是十分重要的生物特征之一,它能够表达出众多的属性信息,来帮助我们在日常生活中进行无需言语的沟通交流。人脸属性包括年龄、性别、种族、表情等生物特征,利用机器学习的方法来识别出各自不同的属性特征即为人脸属性识别算法。现在主流的图像分类算法多采用了基于卷积神经网络的深度学习方法,但对于高度相似且数据繁多的跨域人脸属性识别问题却仍面临着挑战。为了解决
面对复杂多变的国内外经济形势以及党中央所提出的新要求,国企要更好地发展就必须积极地进行管理改革。本文主要针对多元化战略下国企业财一体化对财务管理方面带来的启示进行探讨,希望可以为改进国企财务管理提供借鉴。
为分析施工过程中腹板预应力锚头混凝土破裂修复后连续箱梁结构整体受力是否满足设计要求,本文以某市过江通道及连接线工程为例,分析东侧引桥上层第三联变宽连续箱梁腹板预应力锚头混凝土破裂产生的原因和导致的影响,并基于Midas Civil有限元软件,结合现场实际处理情况进行数值分析,根据得出的预应力损失对成桥状态的影响量值与设计成桥状态进行数值比较。结果表明:锚头混凝土破裂造成主梁弯矩、正应力、主应力和竖
随着人们的生活方式越加丰富,大规模的用户也产生了更大规模的应用数据。为了解决信息过载这一问题,推荐引擎也应运而生。但是就目前来看,大多数推荐算法都是直接将兴趣行为直接视为兴趣结果,而潜在的兴趣很难通过显性行为得到充分体现。大多数方法忽略了挖掘行为背后真正的用户兴趣,并且用户兴趣是不断变化的,获取兴趣之间的的动态关系对兴趣的表示非常重要。因此需要进一步的研究来解决这些问题。为了更好地捕捉用户兴趣之间