【摘 要】
:
神经网络剪枝是神经网络模型压缩的常用方法之一,剪枝算法通过移除网络中的冗余权重实现模型压缩。通道粒度是神经网络剪枝粒度之一,通道级剪枝算法将每个滤波器中的权重作为整体进行移除,减少了卷积神经网络中的通道数量,降低了权重与输入特征图的计算复杂性。由于通道级剪枝保留了矩阵运算的结构化特性,使用通用软硬件,即可实现推理加速,因此通道级剪枝算法广泛用于卷积神经网络的模型压缩场景。绝大多数的神经网络剪枝方法
论文部分内容阅读
神经网络剪枝是神经网络模型压缩的常用方法之一,剪枝算法通过移除网络中的冗余权重实现模型压缩。通道粒度是神经网络剪枝粒度之一,通道级剪枝算法将每个滤波器中的权重作为整体进行移除,减少了卷积神经网络中的通道数量,降低了权重与输入特征图的计算复杂性。由于通道级剪枝保留了矩阵运算的结构化特性,使用通用软硬件,即可实现推理加速,因此通道级剪枝算法广泛用于卷积神经网络的模型压缩场景。绝大多数的神经网络剪枝方法仅关注了压缩后的稀疏模型的推理性能,而忽略了由于使用剪枝算法带来的高昂训练开销。由于神经网络的体量巨大,训练神经网络需要极大的计算开销,当使用剪枝算法对模型进行压缩时,网络的训练开销将进一步增加。额外开销的来源包括但不仅限于以下两方面:(1)剪枝算法评估权重贡献度带来的额外计算。(2)冗余权重移除后的模型微调计算。此外,现有的剪枝方法超参数的设定需要一定的先验知识,当模型或任务发生改变,超参数的设定值将发生改变,无法实现对数据集和网络模型的自适应,因此具有一定的局限性。本文对神经网络剪枝的训练过程进行优化,针对不同初始化方式设计不同的剪枝策略,围绕着神经网络通道剪枝算法的训练优化,开展了一系列工作,具体包括以下两个方面:(1)基于动态阈值与二值化掩码的神经网络剪枝算法本文针对使用分布函数初始化神经网络模型的剪枝问题,提出了一种通道级剪枝算法DMCP。DMCP算法为每个卷积层绑定了一个可训练阈值,并为卷积层的每个通道绑定一个二值化掩码。掩码的取值根据通道权重与阈值计算得出,且随着网络训练过程动态变化。DMCP算法利用得出的掩码值将冗余通道权重归零,使冗余权重对预测目标不产生贡献,实现了在权重移除前后,模型预测结果不发生变化,从而减少了微调步骤,降低稀疏模型的训练开销。实验结果表明,DMCP算法能够显著地降低模型参数的数量。由于DMCP算法对ResNet网络加入了深度自适应,在使用ResNet模型的任务中,DMCP剪枝算法精确度甚至优于未剪枝的完全模型。(2)基于二值化掩码的迁移学习剪枝算法本文针对使用预训练模型初始化的迁移学习任务的剪枝问题,提出了一种通道级剪枝算法MCPT。MCPT算法在迁移学习过程中进行通道重要性筛选,并使用掩码标记冗余通道。与其他方法不同,在MCPT算法中,冗余通道的标记是可恢复的。通过这种设定,将迁移学习过程与剪枝过程融合,简化了迁移学习的剪枝流程。MCPT使用掩码对冗余通道权重归零,使冗余权重对预测目标不产生贡献,从而消除微调过程带来的训练开销。从实验结果上看,MCPT算法除减少了迁移学习剪枝过程的训练开销外,还减少了 40%至85%的模型参数数量。
其他文献
缺铁性贫血已经成为影响人类健康的重要疾病之一,补铁是临床上治疗铁缺乏症的主要手段。自1949年第一个纳米铁制剂——蔗糖铁注射液(Venofer?)被用于治疗铁缺乏症上市以来,世界范围内已批准上市多个纳米铁制剂及其仿制药。纳米铁制剂一般由铁核和不同的碳水化合物外壳组成,铁核、不同的碳水化合物外壳及其相互作用共同决定了纳米铁的体内行为。由于纳米铁制剂属于一种非生物复杂药物(NBCD),活性成分的结构和
由于复杂而精细的电荷、自旋、轨道和晶格自由度之间的相互耦合平衡,钙钛矿结构ABO3型B位过渡金属氧化物展现出丰富多样的物理性质,不仅成为当前凝聚态物理研究的热点之一,在新材料开发应用等方面也有着广阔的前景。因为过渡金属元素具有未充满的电子d壳层,其轨道的电子排布容易发生变化,这种变化不仅对我们理解物质的输运行为有很大的帮助,还有利于过渡金属氧化物在生产技术上的应用。例如,LaNiO3的氧敏特性使其
随着5G时代的来临,电子和光电器件加速发展,电子设备逐渐趋于高度集成化。设备内部消耗的功率越来越大导致器件的安全性、耐用性受到威胁以及大量电磁波辐射干扰电器正常运行、危害人体健康等,这些问题会对设备的使用寿命和人们的生产生活产生影响。制备高散热高电磁屏蔽性能的电子封装材料已成为电子、光电器件进一步发展的必经之路。聚合物在新能源汽车、医疗设备和便携式电子设备等领域的应用越来越广泛,但是其较低的导热系
在当今万物互联的大数据时代,压缩技术对于多媒体数据存储与传输是一项不可或缺的技术。几乎瞬时的可变长到定长编码(Almost Instantaneous Variable-to-Fixed Length Code,AIVF Code)是一类无损压缩算法,它的解析字是可变长的,码字是定长的,并且解析字不需要满足前缀性质。AIVF编码可以带来GB/s级别的解压缩速度,同时对于信道传输中比特翻转错误具备较
新生代时期,亚洲板块和印度板块相互挤压碰撞,形成时当今地球上面积最大、最年轻的大陆碰撞造山带——喜马拉雅造山带,其记录了大量关于大陆俯冲、碰撞以及折返等信息,提供了大量野外研究的真实案例,为认识岩石的成因机制和喜马拉雅造山带的形成和演化提供了关键证据。本学位论文的研究区域位于雅拉香波片麻岩穹窿,是北喜马拉雅穹窿带最东端的片麻岩穹窿。北喜马拉雅片麻岩穹窿带位于特提斯喜马拉雅带上,是高喜马拉雅带在特提
研究目的:应用光学相干断层扫描(OCT)联合多焦视网膜电图(mf ERG)评价蒙药明目十一味丸治疗湿性年龄相关性黄斑变性(wAMD)的临床疗效。研究方法:本研究全部病例来自于内蒙古民族大学附属医院眼科2020年11月至2021年12月收治的湿性年龄相关性黄斑变性患者70例(70只眼),随机分成治疗组和对照组,每组各35例患者(35只眼),每月行1次玻璃体腔注射康柏西普0.05ml,连续治疗3个月。
产业引导基金可以有效引导和带动社会投资,增加创业投资资本有效供给,政府可通过政策实现定向支持新兴战略性产业发展,推动产业结构优化升级。在国家支持下,产业引导基金发展迅速,但其隐藏的风险也不可忽视,特别是投后管理风险尤其重要,投后风险管理效果可能影响产业引导基金最终能否实现政策引导目标。加强产业引导基金投后风险管理,可以提高基金投资能力和投资效益,推动高新技术产业发展,促进产业结构转型升级,促进经济
随着移动通信的不断发展,各类新兴服务不断涌现。诸多新型业务的实现需求能与之相匹配的通信系统的吞吐量。大规模多输入多输出(Multiple-input Multiple-output,MIMO)可以极大提升无线系统的容量。这契合了第五代(5-th Generation,5G)乃至第六代(6-th Generation,6G)通信系统的要求。为了提升大规模MIMO系统的频效、能效等性能,信道状态信息的
家国情怀是中华民族优秀传统文化,是中华民族团结奋进的动力。习近平总书记曾在2019年春节团拜会上指出要在全社会大力弘扬家国情怀和社会主义核心价值观,倡导爱家爱国相统一。高中生作为新时代的主力军,是祖国的未来和民族的希望。所以在高中思想政治课中培养学生的家国情怀至关重要,不仅有利于学生形成正确国家观、民族观和历史观,而且有利于增强学生爱国使命感,为实现中华民族伟大复兴而砥砺前行。该文以高中思想政治课
锂离子电池是近30年来最重要的发明之一,它具有能量密度高、无记忆效应、循环寿命长等优点。然而,锂离子电池在储存、运输和使用的过程中往往并非单一存在,而是以水平或竖直方向排列的电池组的形式出现。当电池组中某一单体电池受到高温、高压、过充或过放等外界刺激时,可能会在模组内引发热失控传播的危险事故。因此,对电池的热失控传播情况进行研究,从而了解热失控传播的热量传递特性,有助于保障锂离子电池组的热安全。对