深度神经网络压缩与加速关键技术的研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:zhan99zhan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度神经网络(deep neural networks,DNNs)迅猛发展,己席卷人工智能各个领域,包括图像理解、语音识别、自然语言处理等,己然成为人工智能研究热点。此外,深度神经网络显著提高各领域多种任务上的性能,也使得它在视频监控、游戏博弈、医疗辅助、自动驾驶等行业中得到广泛应用。然而,随着深度神经网络巨大的性能提升,网络变深加宽,大大增加了模型的参数以及计算复杂度。另一方面,随着移动嵌入式设备的广泛使用(如手机、无人机、机器人等),深度神经网络模型若能应用到这些移动嵌入式设备端,将更大程度提升该设备的功能。不管在军事上的敌情勘探、抢险救灾,还是在民事上的移动智能识别、便民出行都将起到巨大的促进作用。然而,资源受限的移动设备无法直接存储和实时运行复杂的深度网络模型。为此,压缩和加速如此复杂的深度网络模型,减少模型参数的冗余性,提高模型运行效率,将成为一种有效的解决方案,具有重大的理论意义和应用价值。本文针对深度神经网络参数存在大量冗余性问题,从压缩与加速深度神经网络两种不同任务出发,对深度神经网络的低秩分解(low-rank decomposition)和参数剪枝(parameter pruning)通用性方法展开深入研究,特别对于卷积神经网络(convolutional neural networks,CNNs)的压缩与加速。具体研究内容和创新点包括:(1)提出了一种基于闭式低秩分解和知识迁移的全局卷积神经网络压缩方法。传统方法分开考虑卷积层加速和全连接层压缩,无法统一联合处理不同类型层任务,且利用逐层方式进行层内局部压缩,无法显性对齐最终网络分类准确率。针对此问题,本文提出一种全局的卷积神经网络压缩框架,统一加速与压缩卷积神经网络。该框架首先利用一种带有闭合解的低秩分解技术分别加速卷积计算和减少内存开销。为了有效提高压缩后模型的准确率及克服网络训练中的梯度消失问题,本文提出了新的知识迁移方法,用于对齐压缩后网络与原始网络之间的隐层输出及最终网络输出结果。在多个公开的图像分类评测集和评测模型上,该方法在精度和压缩比或加速比之间都达到最佳平衡。例如,相比于原始的VGG-16,该方法能够压缩此模型41.92倍,同时获得2.33倍GPU加速比,top-1分类错误率只增加了 0.18%。(2)提出了一种基于全局动态剪枝的卷积神经网络加速方法。虽然低秩分解后产生若干个小矩阵,能够较大压缩网络模型,但也增加了模型计算时对数据的频繁获取操作次数。另外,该类方法无法减少输出特征图数量,导致模型计算通信带宽显著增加。结构化剪枝能够有效克服此类问题,但现有的结构化剪枝方法依赖于层与层且固定的方式裁剪,缺乏自适应性、低效和低准确率等缺点。针对此问题,本论文提出了一种全局动态更新的滤波剪枝框架,用于快速离线剪枝滤波并动态恢复误删滤波,提高剪枝后网络的分类准确率。首先在每个滤波后引入了全局掩码用于判断滤波的显著性,并构造全局动态目标函数。然后利用贪心交替式更新策略解决非凸优化问题,主要包括设计基于泰勒展开的全局掩码用于临时贪心裁剪显著值较小滤波以及随机梯度下降法更新滤波。相比于已有的滤波剪枝方法,本文方法能够在模型精度和加速比之间获得最好的平衡效果。例如,在加速ResNet-50时,该方法取得了 2.45倍浮点型计算次数的缩减、1.93倍CPU实际加速比,top-5分类错误率只增加了 2.16%。(3)提出了一种基于生成对抗学习的最优结构化网络剪枝方法。针对全局动态剪枝方法缺乏松弛性和强标签依赖问题,本论文提出了一种无需标签端对端训练的异构剪枝方法。该方法对每个模型结构引入了软掩码(softmask),并对其加入稀疏限制,使其表征每个结构的冗余性。为了更好学习模型参数和掩码,本论文构建了新的结构化剪枝目标函数,利用无类别标签生成对抗学习和快速的迭代阈值收缩算法(fast iterative shrinkage-thresholding algorithm,FISTA)解决该优化问题,从而稳定移除冗余结构。通过量化实验,剪枝后的ResNet-50能够取得3.7倍浮点型计算次数的缩减、2.5倍参数压缩,top-5分类错误率只增加了 3.75%,优于目前先进的结构化剪枝算法。
其他文献
随着科学技术的进步,数据的产生、存储方式发生重大变革。数据来源越来越多样化。一方面,数据的主体、格式等越来越丰富,另一方面,数据的测量维度也不断拓宽。多源数据累积成
光子晶体隐身技术是各个国家争相研究的热门领域,并且具有优异的应用前景。本文通过研究光子晶体,设计出在特定的大频率范围内对光波做出完美反射的结构材料,对大范围内隐身
宗教作为一个文化现象或者意识形态,自古以来都给人一种神秘感,并且与人类的发展有着密切而复杂的联系。在当今全球化背景下,人类文明想要健康有序发展,是离不开各个国家间文化交流与融合的。西方传教士来华传教,不仅给中国带来了基督福音,也带来了当时最先进的天文、医疗技术以及教育理念。伴随着我国经济水平的提高,基督教越来越本土化和现代化。本文以中国基督信仰摄影作为研究对象,首先简单梳理了基督教在中国的传播概况
随着电力体制向市场化改革进程的推进与新能源电源接入的增多,电力系统内灵活性资源根据价格信号进行配置成为竞争市场环境下的重要调节手段。与此同时,居民家庭用电在社会用
近年来,社会网络与金融学的交叉研究已成为研究热点,大量金融学领域的学者不断尝试引用社会网络的理论和方法研究这些领域存在的难题。尽管成果丰硕,但尚未有文献借鉴社会网
随着经济的快速发展和人们生活水平的提高,环境污染和能源问题成为人类社会继续发展所面临的最主要问题。太阳每年会给地球输送大量的能量,且太阳能具有绿色清洁、无污染和储
中国石油自1995年走出国门,一直在能源各领域深化国际合作,取得了长足的进步,为祖国的能源安全做出了贡献。GWDC作为中石油旗下上游板块的油田服务企业,属于最早“走出去”的
近年来随着电动汽车行业的快速发展,市场对锂离子动力电池的需求也在快速增加。电动汽车的快速发展对锂离子电池的性能提出了更高的要求,作为电动汽车的重要动力源锂,离子电池需具备储电量大、快速充放电、隔膜稳定性强、寿命长、安全性高等诸多要求。目前为止,制约锂离子电池快速发展的最主要矛盾为:传统工艺生产的锂离子电池隔膜的数量和质量完全无法满足电动汽车行业对锂离子电池的需求。因此有必要使用新的方法和设备来实现
学位
为研究双积分政策中积分结转、转让的政策效果及其对汽车行业产生的具体影响,本文以传统能源汽车生产企业的双积分达标情况以及关联企业满足的条件作为选择标准,选取具有代表
股票回购,是指上市公司通过运用自有资金或债权等方式购回其公司在资本市场上已发行的股票的行为。股票回购本来是传递公司股价低估信号的资本市场的重要工具,然而目前很多上