基于相似性的深度卷积神经网络剪枝研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:fanjin001983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度神经网络有着很强的特征学习能力,以卷积神经网络为代表的深度学习技术,在图像处理、自然语言处理、视频处理等传统人工智能领域均取得了最佳成绩,在学术界和工业界掀起一股“深度学习”浪潮。深度神经网络在当前各个领域有着广泛应用和极大需求,如语音识别、实时翻译、安防、医疗等。将AI技术移植到民众的便携式生活中成为必然。面向便携式移动端设备的模型不一定要求性能最好,但在产品价格、计算资源、部署空间、实时性等方面,对使用体验提出了很高要求。然而,快速增长的网络规模和复杂度使得深度神经网络难以部署于计算资源受限、实时性要求高的移动端,重型网络的轻型化研究成为当前热点领域。本文广泛调研网络压缩相关的各项工作,深入研究卷积神经网络的各个组件和网络模型运行机制,针对性地提出基于相似性的卷积神经网络剪枝技术路线。本文针对全连接层深入研究基于神经元相似性的剪枝方法,剪除全连接层中相似的神经元并删除连接、简化权值矩阵,从而降低卷积神经网络模型规模和计算量。我们应用了标准机器视觉数据集MNIST和CIFAR-10,以及T EN SORF LOW官网上标准的简单卷积神经网络和进阶卷积神经网络结构,设计了多组实验探究不同全连接层之间的剪枝顺序对性能的影响。实验发现小规模网络中的全连接层减去80%以上的单元没有降低网络性能,全连接层存在较大冗余性;同时本文设计了多组实验探究不同的剪枝顺序对最后剪枝性能的影响,部分组实验中全连接层的单元剪枝后模型性能还略有上升,可见模型规模并非越大越好;先剪浅层的全连接层后剪深层的全连接层,能得到更好的剪枝效果,最终能减去近60%的参数量而模型性能未下降。最后本文应用了可分卷积为卷积层加速做了有益的尝试,发现可分卷积可以稍稍加速小型网络的运行,但是性能下降较大,可分卷积对小型网络并不适用。本文针对卷积层提出基于kernel相似性的剪枝方法,减去卷积层中相近的卷积核,从而显著减小模型运行的计算量。本文首先论证了kernel合并的方法,而后分小数目卷积核和大数目卷积核两小节对卷积核的合并作细致的分析验证,设计全连接层与卷积层的不同剪枝顺序,探究卷积神经网络中不同组件在网络中起到的作用。实验发现,卷积神经网络的卷积层也存在冗余性,在全连接层未剪枝时已能剪除15%以上的kernel数而模型性能没有下降;而冗余性也使得网络更加健壮;不同剪枝顺序也能带来不同剪枝性能,先剪conv层后剪全连接层(由浅至深)的剪枝方式取得更好的剪枝性能,不论是参数量的减小幅度还是运算量的减小幅度,最终减去近90%的参数量和近20%的计算量;大数目卷积核实验表明,剪枝的参数量和计算量是trade-off问题,如希望训练均衡性能的轻型化网络,须探索极大的权值空间,迭代剪枝并优化网络结构。基于相似性的剪枝思想可以应用于所有的卷积神经网络,与网络训练数据集也无关,具有普适性,而且网络中普遍存在冗余性,这使得本文的剪枝方案可以应用于深度卷积神经网络。而且多组实验探究了不同的剪枝顺序对未来的剪枝工作有启发式意义,本文在进阶卷积神经网络上减去近90%的参数量和近20%的计算量,获得了当前网络压缩领域的较好结果,却仅仅是对网络做了剪枝而没有采用量化或编码等方法进一步压缩网络。工作的不足之处在于:由于权值空间太大,算法复杂度太高,本文没有在大规模网络和大规模数据集中进行实验。
其他文献
无线自组网在很多领域都有重要应用,如战场环境、临时会场、野外探测甚至是地下矿井等。OLSR协议是已成为国际标准的一个重要的无线自组网路由协议,但是该协议初始设计在安全
各科学领域的采集和处理能力的发展使得科学数据蕴含的价值被不断开发,为了更好地管理和利用日趋增加的科学大数据,研究和设计良好的管理生态或方法来提高科学大数据管理和分析水平成为各科学领域的研究热点。目前,各个机构不断开发以自身领域为导向的科学数据管理系统;科学工作流也已经成为科学家用来构建和执行科学实验的主流工具;为探究科学数据的本质和实验结果的源头,科学家还研究了许多溯源方法来验证、复制和重现科学实
腰椎间盘可以缓冲人体活动载荷,同时,吸收能量来维持脊柱稳定地运动。长时间承受高强度的压缩载荷是导致腰椎间盘突出等退行性疾病成为高发病的重要原因。目前,对于腰椎间盘突出症严重的患者,临床上常采用髓核摘除术予以治疗,由于术后腰椎间盘的结构和材料特性发生改变,使其承载机制和力学性能也随之变化。因此,有必要对正常及退变摘除髓核的腰椎间盘的材料特性和力学性能以及两者之间的差异进行研究。本课题根据参数模型估计
关节置换为关节病变类疾病提供新的治疗方法。和天然关节相比,人工关节不具有自润滑功能,因润滑不足导致关节面磨损引发的关节失效问题依然突出。因此对人工关节耐磨性的研究具有重要意义。微织构自提出以来一直被应用于减磨领域,微织构不仅可以改变摩擦界面的接触类型,还可以改变摩擦界面的润湿性,增大润滑液在固体表面的黏附力。本文将微织构应用于人工关节,从数值仿真和试验两方面研究织构参数对人工关节减磨性的影响,主要
作为创新成果具体表现形式的知识产权,其重要影响对于现阶段的我国资本累计来讲显而易见。使用这一非现物出资的制度本应迅速发展适应市场,但目前我国知识产权出资的相关法律规定并不明确,不同部门法之间的不同规定导致实际操作中矛盾频现,直接导致了使用知识产权投资的风险加大,不利于知识产权的实际投产并产生收益。为了解决这一问题,以更好的适应现代经济的发展,本文主要通过将知识产权出资的理论和实践中存在的风险进行梳
作为国内首创的省际深度合作开发试点,自启动以来,粤桂合作特别试验区认真贯彻落实国家区域合作发展战略部署、粤桂两省区推进珠江——西江经济带建设行动计划和试验区建设实施方案,全力做好“大胆试验、用足政策、项目布局”三篇文章,大胆探索改革路径、创新合作模式,争取发挥示范作用、形成带动效应。然而,随着开发建设进程的加快,试验区的配套政策、产业结构、治理机制等方面难以与当前高效快速发展需要相匹配,制约了试验
微带天线是比较成熟的天线类型,但是又经久不衰、不断发展。微带天线具有体积小、剖面低等其他显著优点,但也存在增益低、工作带宽窄等缺点。新型人工电磁表面是一个新兴的热
随着社会经济的快速发展,人们对于财富的创造、积累与享用越来越关注。但人们对财富应该有一个全面的认识,不能盲目崇拜财富,陷入金钱至上的拜金主义。虽然财富是生活所必须
卫星通信系统具备广泛的覆盖范围和强大的通信能力,作为补充地面移动通信系统不足的通信技术而受到广泛的关注。在考虑差异化服务的固有不确定性以及容量请求的非均匀空间分布时,必须灵活调整卫星资源以满足不同的需求。其中,多波束卫星通过调度多个高增益的窄波束实现覆盖更大区域的目的,能有效降低卫星的有效负载并提高卫星系统性能,在提高通信质量和数据传输速率方面起着至关重要的作用,因此受到研究人员的广泛关注。如何将
公务员制度在我国已经推行了二十多年,期间,从中央到地方的考试规定中无一例外设置了“18至35周岁”的年龄条件。但2004和2005年接连发生了两起考生因年龄超过35周岁未能报考公务员而状告人事部门的案件。同时,近些年呼吁放宽公务员报考年龄的声音也一直不断。可见放宽公务员考试的年龄上限已成为不少公民的诉求。基于以上,本文认为需要重新对公务员招考中的年龄上限设定进行思考。由于国家机关录用行为具有双重性