面向YOLO网络的动态量化与优化算法研究

来源 :中国运载火箭技术研究院 | 被引量 : 0次 | 上传用户:cg120900230
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度神经网络(DNN)在计算机视觉、自然语言处理和优化控制等各种任务中得到了广泛应用。随着DNN设计的越来越深,高计算资源需求阻碍了其在嵌入式设备上的大规模应用。面对这一问题,人们提出了各种压缩技术,包括剪枝、量化、蒸馏等。而在嵌入式设备的神经网络推理加速硬件上,提高DNN计算效率最普及的方法是使用较低精度的网络表示,即量化。大多数关于神经网络量化的方法都涉及到从头开始的训练,或者作为预先训练的浮点精度模型的微调步骤。但训练需要时间、人力和计算资源。重训练和微调都依赖全尺寸的数据集,由于各类的原因,如隐私和知识产权保护,特别是在航天航空等领域,原始数据集无法获得。本文研究了训练后量化问题,即在不重新训练模型的情况下,对预先训练好的深度神经网络的权重进行离散化。这种方法被称为训练后量化,只需要一个小的校准数据集。本文研究了卷积神经网络(CNN)的计算特性,选择了目标检测任务中应用最广泛的网络YOLO(You Only Look Once)作为研究对象,在不需要重训练及微调的情况下,对已训练好的浮点模型进行量化,分析了网络的量化噪声。在应用动态量化之前,折叠卷积层与批量归一化层,加快模型推理速度;并通过优化张量离群值缩小量化范围,减小量化误差。本文对预先训练好的YOLOv3网络进行量化,将网络权重和偏置使用动态定点数表示,设计了动态量化指数管理算法,并针对网络输出层进行了优化,减小了量化导致的预测框误差。在全定点化的计算平台上进行量化后网络的推理,使用PASCAL VOC2007测试了不同量化位宽对模型精度的影响。本文对YOLOv3量化网络进行了层级优化,通过放大数值范围较小的通道和补偿下层对应通道,用高效的贪婪选择程序构建多层间均衡量化。网络中前一层的噪声会被带入下一层中,在参数较少的浅层中,量化的舍入误差使激活值产生了偏移。通过在卷积层将偏置减去该层激活值偏移的统计值,可以修正此误差,减小量化网络的退化。在不重训练和微调的情况下,对YOLOv3进行INT8动态量化并优化,精度损失小于0.5%,实现量化模型的快速部署。
其他文献
《普通高中生物学课程标准》中要求学生通过对高中生物课程的学习,初步掌握生物科学探究的一般方法。"科学探究"主要是指对结论未知的问题进行研究,是在这个前提下"做出假设和预期、确认变量、设计可行的研究方案、处理和解释数据、根据数据做出合理的判断"等。遗传学"科学探究"试题通过与基因分离定律、自由组合定律、伴性遗传、基因突变等相结合,测评学生对遗传学知识和能力目标的掌握程度,同时测评学生的科学探究
期刊
目的评价复方侧柏酊治疗斑秃的疗效与安全性。方法收集我院2020年6月到2021年5月的斑秃患者60例,随机分入治疗组(n=30)和对照组(n=30),治疗组一日2次外用复方侧柏酊,对照组一日2次外用市售5%米诺地尔酊,两组均治疗24周。运用脱发严重程度评定量表(SALT)评估两组治疗前后SALT较基线变化的百分率,比较两组达到SATL50的患者人数,观察治疗前后不良反应,评价复方侧柏酊治疗斑秃的有
图谱指的是在音乐课程教学中所要用到的曲谱或乐谱,它是由不同符号线条来进行音乐旋律和节奏呈现的一种书面化表现形式。换句话说,图谱就是音乐的书面化表现语言。如果学生能够学会阅读图谱,那么便能更好地把握音乐作品的旋律和节奏。因此,教师需要在小学音乐课堂中引导学生进行图谱的学习,并以图谱为辅助教学工具,让学生充分感知音乐的魅力,使日常的音乐课堂教学变得更生动、有趣。
期刊
决策树分类算法在数据挖掘领域是一种高效且应用普遍的分类算法。传统的决策树算法难以处理数据中存在的模糊性等不确定性信息,模糊决策树作为经典决策树在模糊集理论上的扩展,可有效克服这一缺陷,然而,现有的模糊决策树算法在处理具有层次结构的标签数据时,一般选取层次结构的某一层标签去分类数据,导致当分类准确率高时,标签不具体;标签具体时,分类准确率低,无法有效做到在分类准确率尽可能高的情况下,层次标签也尽可能
A high-voltage pulsed discharge(HVPD) pretreatment was used to strengthen the leaching effect of Carlin-type gold ore containing arsenic. Optimal results of the pretreatment experiments were obtained
期刊
喷管是液体火箭发动机产生推力的装置,喷管性能分析和传热计算是喷管设计的重要部分,而实现它们的方法便是对喷管流场进行仿真计算,对于追求高效率的工程应用来说,流场计算希望既快且准。而针对火箭发动机喷管流场超高雷诺数的特性,其大部分流动区域实际上处于近似无粘状态,仅有壁面薄层需要考虑粘性效应,因此无粘流场结合附面层修正是工程上最适合喷管流场分析的计算方式。本文在已有无粘化学动力喷管流场求解器的基础上研究
随着航天技术的飞速发展,航天测控系统软件需要适应各种设备、各种频段任务、各种型号飞行器的测控要求,软件需求变化快,软件状态明确晚,软件研制周期短,连续运行时间长,软件质量要求高,软件结构也变得越来越复杂,因此目前航天测控系统软件需要探求新技术、新架构以适应航天测控系统需求。本文以航天测控系统为切入点,通过研究虚拟化、服务通信、资源调度、服务管理等关键技术,将微服务架构思想融入到航天应用软件设计中,
随着人们对导航定位服务的日益依赖,导航系统的可靠性越来越受到关注。GNSS接收机易受外界干扰,信号传播中的多路径效应、城市复杂的电磁干扰环境以及人为的欺骗等都可能造成导航系统的故障。因此,需要借助一系列相关技术,克服接收机干扰提高接收机的可靠性。本文涉及GNSS/INS矢量深组合导航接收机的故障检测与隔离技术,涵盖的主要技术有如下几点:故障检测与隔离技术是提高GNSS接收机性能并提高抵抗干扰能力的
脉冲等离子体推力器(Pulsed Plasma Thruster,PPT)以其功率灵活可变、结构简单、可靠性高、在低功率下能够保持高比冲等特点,可用于执行微小型卫星的姿态控制、阻力补偿以及星座相位控制等任务。随着PPT受到越来越多的关注,如何研制高性能的PPT成为一个亟待解决的问题。等离子体的产生和加速过程直接影响着推力器的性能,因此有必要从PPT的工作过程出发,对放电通道内等离子体的产生和演化机
液体火箭发动机变推力调节是当今航天推进领域的关键技术,对确保航天任务的成功具有重要意义。本文采用静态仿真和动态仿真的方式分别对氢氧补燃发动机推力调节方案和调节过程开展了仿真研究,重点就推力调节方案的选择、流量调节阀动态特性以及流量调节阀对推力调节过程的影响进行了深入研究。本文对液体火箭发动机各组件开展了理论分析,建立了燃烧组件、涡轮泵、冷却夹套、节流元件和管路等主要组件的数学模型,并提出了一种收敛