基于深度压缩的卷积神经网络压缩算法研究

来源 :东南大学 | 被引量 : 1次 | 上传用户:sherpa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习近年来一直是人工智能领域的热门研究课题,卷积神经网络(Convolutional Neural Network,CNN)作为深度学习的经典学习模型,在图像分类、目标检测、自然语言处理等领域均取得了一系列重要突破。卷积神经网络模型具有参数量大,计算复杂度高的特点,正是这种复杂的多层次网络结构使得模型具有很强的预测能力。由于智能设备的普及,卷积神经网络移植到嵌入式设备上的需求日益增长,但是其巨大的参数冗余以及计算成本限制了它在嵌入式设备尤其是移动设备上的部署,于是众多的神经网络压缩算法应运而生,其中“深度压缩”算法以其突出的压缩性能被广泛应用于大型神经网络的压缩。本文基于卷积神经网络压缩算法进行深入研究,并针对“深度压缩”算法做出了一些改进,主要内容如下:(1)本文提出了基于“深度压缩”算法的动态剪枝和动态量化算法。“深度压缩”算法对大型卷积神经网络的压缩具有令人瞩目的压缩效果,但是该算法在剪枝以及量化过程中忽略了各层权重的不同数量级以及对输出的贡献度,针对此问题本文提出了动态剪枝和动态量化算法,对不同权重数量级的层进行分类,并分别设置阈值和聚类数目,在设置阈值时将简单的指定一个值改为按比例设定阈值,实验结果表明压缩效果要优于传统的深度压缩算法。(2)本文提出了一种用于压缩复数卷积神经网络的改进的“深度压缩”算法。目前许多研究工作都关注于实数卷积神经网络(Real Convolution Neural Network,Real CNN)的压缩,据我们所知,目前复数卷积神经网络(Complex Convolution Neural Network,Complex CNN)的压缩算法还没有论文涉及。与实数神经网络相比,复数神经网络更容易优化,有更好的泛化能力和学习能力,并且对噪声更加鲁棒。本文将“深度压缩”算法从实数域扩展到了复数域,提出了一种用于压缩复数卷积神经网络的改进的深度压缩算法。由于复数卷积神经网络的权重是复数形式,考虑到其虚数部分和实数部分的相关性,我们在剪枝、量化和哈夫曼编码过程中做出了以下改进:1)剪枝阶段:使用复数的模与阈值进行比较;2)量化阶段:使用二维K均值聚类算法对复数权重进行聚类,聚类中心即为共享权重;3)哈夫曼编码:由于复数权重的虚数部分与实数部分的相关性不影响哈夫曼编码的结果,将权重的实数部分与虚数部分分别进行编码。本文提出的压缩算法可以将适合于CIFAR-10数据集的卷积神经网络的参数量压缩8倍,在没有重新训练的情况下准确率损失在3%以内;将适合于IMAGENET数据集的卷积神经网络的参数量压缩16倍,在没有重新训练的情况下准确率损失在2%以内。
其他文献
土是颗粒、水和气组成的三相体系,水含量的大小直接影响土体的性质,高含水量土体的强度相对较低、变形较大。特别是对于广泛分布我国西北地区的湿陷性黄土,水的浸入会导致土
土壤微生物是土壤环境中不可或缺的一部分,对整个土壤生态系统至关重要。但随着稀土元素的需求日益增长,稀土矿石开采和提炼过程中产生的大量固体废物对土壤环境构成严重威胁
本文针对淮南采煤沉陷区铁路专用线在不断加高后存在的稳定性不足的问题,提出了用粉煤灰轻质填料代替煤矸石进行复杂工程地质条件下路堤维护加固治理,通过室内试验的手段,研
中药材中的天然药物成分非常复杂,其含有的活性成分的分离纯化是一项艰巨而细致的工作,葛根是一种常见的中药材,其中的活性成分染料木黄酮因其存在一些结构相似的成分并且含
Cu2O是一种理论光电转化效率高、可见光响应、无毒、制备成本低廉的具有发展前景的光催化剂,但在实际应用中存在光催化失活、光催化效率低的问题。本论文以结构均匀的非晶态
布尔可满足性(Boolean Satisfiability,SAT)问题是指,给定一组布尔变元X及由X构成的CNF公式,问是否存在一组对X的赋值,使得公式为真。SAT问题是第一个被证明为NP完全的问题,在计算理论中具有重要地位。如果找到能够在多项式时间求解SAT问题的完备方法,则P=NP;反之,如果能够确定所有SAT算法的最坏时间复杂度下界为指数级别,则P≠NP。此外,SAT问题在电路验证、组合优
三维重建技术广泛的应用在数字城市和考古学领域,目的是还原真实场景和更好的保护文化遗产。目前,常用的三维重建技术有立体测量技术和激光扫描技术,两种方法各有利弊:立体测
随着信息科学的快速发展,个人信息安全变得愈发重要;人脸识别因其所具有的隐蔽性、唯一性等众多优势,成为鉴别个人信息的重要手段。近几年来,针对人脸识别的研究越来越多。在
在传统监督学习中,每个训练样本由一个训练示例和一个类标记组成。在现实世界的应用中,每个训练示例有可能和多个类标记关联。多标记学习的任务是训练一个预测模型为一个未见
西北地区夯筑土遗址作为人类文明的重要建筑类型之一,是我国历史、文化、科学等重要信息的载体。随着时代的变迁与进步,土遗址正在遭受着人类活动和自然环境等因素的破坏。锚