【摘 要】
:
卷积神经网络近几十年有了很大的进展,性能越来越强劲,应用场景越来越多。但是与此同时,卷积神经网络的结构也变得越来越宽,越来越深,参数量越来越大,这对运行该卷积神经网络的设备的算力和内存资源也提出了要求。这种情况很大程度上阻碍了其实际应用。因此,对神经网络模型进行压缩,使得性能优异的神经网络模型也能在资源有限的条件下使用,这对于深度学习算法的应用意义重大。在本文中,我们提出了两个对卷积神经网络的结构
论文部分内容阅读
卷积神经网络近几十年有了很大的进展,性能越来越强劲,应用场景越来越多。但是与此同时,卷积神经网络的结构也变得越来越宽,越来越深,参数量越来越大,这对运行该卷积神经网络的设备的算力和内存资源也提出了要求。这种情况很大程度上阻碍了其实际应用。因此,对神经网络模型进行压缩,使得性能优异的神经网络模型也能在资源有限的条件下使用,这对于深度学习算法的应用意义重大。在本文中,我们提出了两个对卷积神经网络的结构化剪枝方法。一个是基于泰勒展开的数据驱动剪枝算法,另一个是基于注意力机制的剪枝算法。两个方法都是先度量卷积核的重要性,然后根据卷积核的重要性值以及裁剪比例确定剪枝后的结构。正是因为剪枝的单位是卷积核,所以两个方法都适用于现代卷积神经网络结构,不需要特殊的软硬件加速器。实验证明,两个方法都可以在几乎不影响精度的前提下,大大减少卷积神经网络的参数量。基于泰勒展开的数据驱动剪枝算法假设:某个参数对损失值的影响越大,就认定该参数越重要。基于该假设,我们使用泰勒展开近似逼近某个卷积核对损失值的影响,来确定该卷积核的重要性。由于卷积核的参数量多且数量不同,我们引入了门机制,将泰勒展开的对象从卷积核的全部参数简化为一个参数,如此得到了该卷积核对应通道的重要性度量,然后根据裁剪比例就可以得到剪枝的结果。基于注意力机制的剪枝算法利用注意力机制模块可以增强重要通道,抑制次重要通道的特点,在待压缩的卷积神经网络引入了注意力机制模块获取通道的重要性度量,同时为了使得到的通道重要性之间的差异更大,进一步引入了稀疏项约束,稀疏项对注意力机制的参数使用(?)1范数约束。根据得到的通道重要性度量以及裁剪比例,对待压缩神经网络做剪枝并且重新训练得到压缩后的神经网络。实验结果证明引入稀疏项对剪枝结果有着明显的提升。
其他文献
近年来,人工智能领域蓬勃发展,同时也存在一些问题和挑战。其中,数据孤岛,用户隐私保护导致的数据割裂问题尤为受到人们的重视。在各行业中,不同机构,同一机构不同部门的数据通常存在屏障,不能被直接共享或交换,表现为数据以“孤岛”的形式存在,这使得大数据驱动的人工智能技术难以充分发挥价值。此外,随着国内外数据隐私保护法规的不断完善,对企业在用户数据的收集、存储和使用环节中提出了高的用户隐私保护要求,这提高
伴随着无线设备的快速发展,现如今越来越多的车辆都配备有大量的无线设备,使利用大规模的车载网络成为了可能,因此,工业界和学术界对车载自组织网络(VANETs)产生了极大地兴趣。车载网络通常会因为车辆的行驶速度快,网络节点间的拓扑结构变化频繁,以及车载无线设备带宽低等问题,导致网络质量不佳。本文采取的解决方案是,利用路侧停放的车辆,将路侧停车加入车辆网络,利用停放的车辆中的无线设备进行网络的数据分发,
针对人工智能实际应用环境中的数据孤岛效应和数据隐私保护,联邦学习框架应运而生。本文研究了基于卷积神经网络的联邦学习算法,主要包括:(a)针对个性化,研究了联邦学习的框架下多个客户端联合训练,最终为每个客户端学习其对应的个性化模型;(b)针对通信瓶颈,研究了联邦学习中的通信压缩。具体的主要研究内容如下:(1)本文提出了基于子类个性化的联邦学习算法(Subclass Personalized Fede
基于会话的推荐系统作为一种有效的技术手段可以帮助用户发现与其当前会话中兴趣相关的物品。与传统推荐系统相比,会话推荐由于能够仅根据在进行的会话期间观察到的用户行为来进行推荐而具有高度实用性,受到研究者的广泛关注。当前研究主要将基于会话的推荐任务建模为根据现有点击序列数据预测用户的下一次点击问题,主要采用基于深度神经网络和表示学习的方法,利用会话中的物品点击序列提取与用户兴趣相关的特征,生成用户最可能
Spiking神经网络(SNN),作为第三代人工神经网络(ANN),模拟了大脑中神经元的信息处理方式,具有高度的仿生性和生物可解释性。相比于第一代ANN(使用M-P模型作为网络的计算单元)和第二代ANN(通过非线性的激活函数来处理线性不可分问题),SNN因为其独特的信息编码和处理的方式,具有更强大的计算能力。但是目前常见的SNN模型在计算上都非常复杂,不利于网络模型的扩展,而且也缺乏比较高效的算法
随着深度学习方法的不断突破,计算机辅助诊断技术在医学影像分析领域得到越来越多的发展。医学影像分析作为计算机辅助诊断技术的关键,其依赖的是基于图像处理技术的深度学习方法,本文涉及的膀胱镜肿瘤影像分析更是依赖基于深度卷积神经网络的多目标检测方法。但膀胱镜检影像样本和标签数量无法摆脱欠缺的问题,面临着小样本场景下的膀胱肿瘤感知技术难题。本文立足于深度卷积神经网络,从小样本场景的多目标分类和检测着手,重点
近年来,深度神经网络模型已经能在各种分类任务中达到很高的准确率,然而最近的研究表明,深度神经网络容易受到对抗样本的攻击,攻击者只需在干净样本中添加一些人眼无法识别的微小扰动,就可以生成对抗样本,从而轻易地使深度神经网络模型对其产生错误分类,随着深度神经网络广泛应用于各个领域,对抗样本使这些深度神经网络系统面临巨大的安全威胁。因此,为了减少对抗样本对神经网络的影响,提高神经网络的鲁棒性,对深度神经网
随着智能交通系统的不断发展,我国的交通管理也在不断进步,现已有很多城市普及安装了一体化自动识别车牌系统。车牌识别是智能交通重要的一环,往往起决定性作用。车牌识别应用现状主要在固定的条件下进行,如对小区门口进出车辆的车牌识别。随着适用场景范围的扩大,车牌识别技术面临着更多的问题。目前,摄像头拍摄的图像采集技术已经相当成熟了,但当应用场景的需求扩大后,车牌定位和识别技术仍然需要进一步发展。随着人工智能
命名实体识别和关系抽取是自然语言处理领域中两项主要的信息抽取任务,旨在从无结构文本中抽取实体和关系,由它们共同组成的关系三元组可以直接应用于知识图谱的构建,同时也在信息检索、问答系统等上层应用中起着至关重要的作用。通过对现有算法的设计思路和建模机制进行深入分析后,发现这些方法存在以下几个不足之处:第一,传统研究方法将命名实体识别和关系抽取以管道的方式分两步处理,采用两套不同的模型结构及参数,割裂了
语音识别系统已经成为了人们工作、学习和生活中行之有效的工具。智能手机微信的语音输入辅助、智能家居的声控电视、声控的行车导航系统和自动会议语音转录系统等都是它可以被应用的场景。但语音识别系统仍有不少瑕疵,这使它不能很好的落地和应用到需要的场景中去。变化的噪声类型、低信噪比和说话人种类等声学条件极大地影响了语音识别系统的性能。因此,一个好的语音增强模块可以成为语音识别系统重要的前端。但是,基于映射的语