基于通道剪枝的深度神经网络压缩与加速方法研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:sakuma556
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自感知机和反向传播提出以来,人工神经网络在人工智能应用领域中迅猛发展。近年,深度神经网络作为传统神经网络的改进引起了学术界和工业界极大的研究兴趣,并在图像识别、信号和信息处理等多个应用领域取得显著成果。然而,随着深度神经网络模型复杂化,模型参数和计算量的增加为深度神经网络模型在移动终端上的部署带来巨大的挑战,促进了深度神经网络压缩技术的研究蓬勃发展。深度神经网络压缩的目的在于在不降低模型性能的前提下,减少网络参数量和加速网络推理。但是现有的网络压缩算法存在压缩时间成本高、缺乏多任务网络模型压缩研究等问题。本文针对单模型压缩和多模型压缩算法存在的难点与挑战,分别从网络模型中滤波器内部冗余信息的去除、网络模型中网络层的冗余滤波器的去除以及网络模型中冗余结构的去除三个层面,研究高效的深度神经网络压缩算法。本学位论文的主要工作和研究成果如下:(1)提出了一个基于多目标优化的深度加权稀疏网络模型,自适应去除网络模型中滤波器内部冗余信息。传统的神经网络稀疏性约束通常对网络中所有神经元施加以相同的稀疏性约束先验,而这样的约束会导致部分高激活值的滤波器丢失有效信息,部分低激活值滤波器保留大量冗余信息。本文在深度神经网络模型中引入加权稀疏性约束有效减少滤波器冗余信息,约束网络模型将有效信息集中于部分滤波器中,从而有助于网络压缩;建立多目标优化模型,自适应选择动态超参数加权稀疏权重;拆解模型更新过程为重构误差优化和稀疏梯度计算两个部分,缩短模型更新时间;采用阶段性超参数共享优化策略,进一步地降低优化过程的时间成本。实验结果显示在相同压缩度约束下对加权稀疏网络模型进行剪枝可以获得精度更高的压缩模型。(2)提出了一个基于滤波器索引式共享的多模型剪枝算法,压缩多模型中冗余滤波器。现有的网络剪枝方法大多是针对单个网络结构,即在单个数据库上建立深度神经网络模型,然后进行剪枝操作。本文认为多个数据库上的模型同样可以提取到相似特征,共享这部分滤波器不仅可以实现模型压缩,还可以通过不同数据库之间的信息交互提升压缩模型性能。针对基于准则的多模型压缩中面临的滤波器重要性度量准则设计、选择滤波器处理方式、多模型压缩度分配、多模型精度恢复以及压缩算法可推广性等方面的挑战,本文设计了针对多模型压缩的重要滤波器度量准则,以多目标优化方式选择重要滤波器;提出滤波器共享策略自适应决定网络中每个滤波器的相应操作(剪枝、合并或者保持不变);建立索引矩阵存储相应的操作以指导压缩模型精度恢复;针对多模型压缩度分配问题,提供两种不同的多模型压缩度设置方式。实验结果表明,本文算法在单模型压缩、两模型压缩和多模型压缩中都取得良好的压缩效果。在相同压缩度前提下,多模型压缩算法的每个压缩模型都可以恢复至高与单模型压缩的压缩模型的模型精度。(3)提出了一个注意力机制诱导的可微通道剪枝算法,建立网络模型剪枝策略并通过注意力评分诱导剪枝策略的优化。基于网络架构搜索的方法可以充分利用网络结构信息,但是时常面临搜索空间大、搜索速度慢等问题。为了克服上述缺点,本文引入Gumbel-softmax采样使得网络架构搜索策略的优化过程可微,同时通过注意力评分为剪枝策略优化提供先验信息。考虑到直接引入注意力模块将会导致最终压缩模型参数量和计算量的增加,本文设计了一个两阶段迭代式训练方法交替优化注意力模块和网络参数,保证注意力模块可以在不影响模型精度的前提下从压缩网络模型中移除。针对具有shortcut结构的网络模块(如ResNet网络)设计特殊网络架构搜索策略,使得网络模型在宽度和深度层面都可以得到压缩。最后将算法推广至多模型压缩中。实验和可视化结果表明层信息诱导的有效性以及提出算法可以获得精度损失更低的压缩模型。(4)提出了一个基于超网络的多任务紧凑模型,通过超网络生成多任务紧凑模型参数。为了充分挖掘多任务之间的关联信息并解决多任务模型压缩后重训练成本问题,本文设计了一个自适应生成网络参数的超网络模型。该超网络模型包括两个组成模块:针对特定任务的特征提取器模块和任务共享的参数生成器模块。具体来说,特定任务的特征提取器会针对任务提取相应特征,该特征将作为参数生成器的输入,参数生成器接受输入后生成多任务模型所需的网络参数。因为多任务学习中的不同任务具有相关性,参数生成器可以快速有效地学习特征到网络参数的映射关系。本文提供两种多任务紧凑模型特征选择方法:直接使用多任务特征均值和通过进化算法选择紧凑模型特征。通过该算法获得的多任务紧凑模型无需进行微调或重新训练,极大地减少了训练时间成本。多任务实验结果证明,通过超网络模型可以获得具有相同压缩度且性能优于对比模型的多任务网络模型参数。
其他文献
传染病,包括鼠疫,霍乱,艾滋病,禽流感等,一直以来都是影响全人类生存发展的重大问题.传染病动力学通过对疾病内在的传播规律进行描述,运用确定性微分方程建立传染病传播的数学模型,预测疾病的发展趋势,研究最优控制策略,为如何遏制传染病扩散提供了重要的理论支持.然而自然界中噪声无处不在,无论是一天内光照强度的变化,或者是季节交替产生的温度、湿度的改变,都会对疾病的扩散产生影响.随机噪声一般分为两大类:一类
学位
报纸
射频移相器在军用和民用领域均有广泛的应用需求,尤其是在当下炙手可热的微波毫米波相控阵系统中,数控移相器可用来改变波束方向。研究和设计高性能、低成本的移相器具有非常重要的意义。本文基于40nm CMOS工艺,对Ka波段数控移相器进行研究和设计,分别完成五位数控无源移相器和六位数控有源移相器的电路设计、前仿真、版图设计以及联合仿真等工作。两款移相器主要采用增设冗余位的方式来提高移相精度。五位数控无源反
学位
近年来,携带轨道角动量(Orbital Angular Momentum,OAM)的涡旋电磁波引起了研究者的关注。与平面波不同,涡旋电磁波的等相位面具有螺旋型结构,这种相位特征有望提升电磁波的信息传输与获取能力。涡旋电磁波在理论上具有无穷多个模式,且不同模式之间具有正交性。这一特性已被应用于无线通信中,将不同的信息调制在不同的模式上,能够极大地提高信道容量,有望解决日益突显的频谱资源紧张的问题。另
学位
滚珠丝杠副作为高档数控机床的核心功能部件,其精度和可靠性直接决定着数控机床的精度和可靠性。近10年来在国家科技重大专项的引导和支持下,国产滚珠丝杠副得到了快速发展。可靠性作为滚珠丝杠副综合性能优劣的直接体现,也是关系到其能否占领市场的关键因素。国产滚珠丝杠副可靠性MTBF为进口产品的三分之二左右,使得国产滚珠丝杠副在中高端市场占比不高。滚珠丝杠副是典型的小样本、长寿命的产品,传统可靠性技术只关注失
学位
本文研究Schr(?)dinger-Boussinesq系统的低正则局部适定性,广义Boussinesq方程和广义Schr(?)dinger-Boussinesq系统的适定性和散射性质。第2章研究阻尼型Schr(?)dinger-Boussinesq系统的局部和整体适定性以及解的爆破。我们利用压缩映像原理,经典的Schr(?)dinger方程的Strichartz估计和Wang,Su[1]中关于阻
学位
随着现代通信技术的发展,各类无线通信系统对天线的隐蔽性和环境适应性提出了越来越高的要求。水天线因其具有高透明度、可塑形、成本低等优势,在对与可见光波段设备共形、隐蔽性等方面存在特殊需求的侦查、通信应用中具有广阔的应用前景,吸引了很多人的关注。本论文对水天线的可重构设计理论和技术进行了深入系统的研究,具体研究工作如下:1.提出了一种双波束与全向波束可重构纯水环天线:该天线将截面为圆形的水柱弯曲成环,
学位
<正>《义务教育历史课程标准(2011年版)》对统编版初中七年级"隋朝的统一与灭亡"一课的教学要求是:知道隋朝的统一,了解科举取士制度的创建和大运河的开通,知道隋朝灭亡的原因。教科书以隋的统一、开通大运河、开创科举取士制度、隋朝的灭亡四个子目呈现上述内容。据此,笔者以隋朝的
期刊
系统失效通常会带来成本或安全方面的严重后果,如导致重大的经济损失、人员伤亡或环境危害。在很多情况下,在系统发生失效之前,会先经历一个或多个缺陷状态,可以用离散退化过程模型来描述这种从正常—缺陷—失效的多状态退化失效过程。在此过程中,通过检测发现系统的缺陷状态,在其未失效时提前采取适当的预防性维修措施,可以有效减少将来可能的系统失效。但是,在实际中,由于技术的限制和环境的影响,检测通常会出现误差,如
学位
随着互联网短视频行业的不断发展、短视频用户的不断壮大,短视频行业准入门槛低、内容参差不齐的特点也逐渐暴露出来。且随着硬件技术的不断迭代与智能算法的持续发展,网络平台利用推荐算法进行短视频推荐的行为已经是行业的普遍做法。推荐算法的介入为网络平台短视频著作权侵权问题带来了全新的挑战,即当推荐算法所推荐的短视频涉嫌侵权时,平台是否该承担责任以及承担何种责任。而无论是理论上还是司法实践中,问题争议的焦点都
学位