论文部分内容阅读
近几年,深度神经网络因其出色的特征提取能力,在计算机视觉、自然语言处理等领域都取得了突破性的进展。深度神经网络的迅速发展也不断带动着其在工程领域的广泛应用,但深度神经网络在性能提升的同时也带来了模型计算复杂度增加、模型存储密集等问题,这限制了其在资源受限的嵌入式设备上的应用。模型权重剪枝作为模型压缩的一种有效方法,就是为了解决以上问题。本文关于模型权重剪枝的工作主要归纳如下:1.介绍了模型压缩基本框架,并对目前国内外模型压缩研究现状进行调研,总结分析了各种方法的优势和不足。2.提出了基于间隔阈值搜索的自适应剪枝及其改进算法。目前的剪枝算法大都以剪枝率指导模型剪枝,这需要不停手动尝试不同剪枝率以获得最佳模型,耗时且低效。针对该问题,本文提出的算法以模型准确率指导模型剪枝,通过设定准确率下降阈值的方法不仅保证了模型准确率损失在给定范围内,同时在工程领域对准确率要求不同的应用场景,也可自适应进行准确率调节以达到尽可能好的剪枝效果。该算法首先在参数的绝对值极值范围内设定等间隔值,然后对这些间隔值通过网格搜索方法找到准确率下降满足要求的最佳剪枝阈值,从而实现模型自适应剪枝。在此基础上,本文结合二分查找法并改进模型参数更新策略,进一步优化已有算法,提升了算法有效性。3.提出了基于离散余弦变换的频域剪枝算法。目前的剪枝算法大都在空域上进行,而参数之间的潜在相互关系有时候在空域上较难被体现。针对该问题,本文借鉴离散余弦变换在图像压缩上的成功经验,提出基于离散余弦变换的频域剪枝算法。该算法首先通过离散余弦变换将空域上的参数变换到频域,然后利用已提出的间隔阈值搜索方法在频域上找到最佳剪枝阈值,并进行模型剪枝。考虑到输入数据对模型参数重要性的影响,本文提出数据驱动的频域剪枝算法,证明空域上卷积运算与频域上乘积运算的一致性,从而加强了模型参数与输入数据的关联,并实现了神经网络模型在频域上的参数更新。本文采用PyTorch深度学习框架在三个神经网络中测试了本文算法,并对实验结果进行对比分析,最后对剪枝模型进行稀疏存储,验证了其工程应用价值。