基于多阶特征信息的语义分割网络压缩方法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:akuma7040
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义分割性能的提升得益于模型规模的不断扩大,然而随着模型复杂度的提高,其参数和浮点运算量也在增加。为了将高性能模型部署在资源受限的设备上,模型压缩技术应运而生。神经网络剪枝和知识蒸馏是两种简单且高效的压缩方法,现有的剪枝方法在使用特征信息评估滤波器的重要性时忽略了特征间的关系,且对语义分割网络剪枝后的微调流程较为复杂。此外现有方法还未考虑特征中的干扰信息对滤波器评估的影响,跨层的重要性之间也存在较大差异。现有的知识蒸馏方法所选用的学生和教师网络结构差异较大,因此很难达到近似的精度,且未考虑目标大小对蒸馏损失的影响。针对以上问题,本文展开了一系列的研究,主要的内容如下:1).针对特征间关系未被充分利用,以及剪枝后的语义分割模型微调问题,提出了一种基于二阶特征信息的语义分割网络压缩方法。首先,以输出特征和特征间的相关性作为一阶和二阶特征信息,使用相关性来评估特征图中包含重合信息的多少,将生成较多重合信息的滤波器作为次重要部分剪掉。然后,分别以剪枝前和剪枝后的模型作为教师和学生网络,将剪枝前网络中的多阶特征知识迁移到剪枝后的网络中,并使用标签中的信息来为不同大小的目标设置蒸馏损失权重,使学生网络可以学习到各目标均匀的知识。实验结果表明,该方案仅使用语义分割数据集就能使剪枝后的模型恢复到较高的精度。2).针对特征图中的干扰信息影响滤波器的重要性评估,以及跨层重要性存在一定差异的问题,提出了一种基于多源信息的全局滤波器剪枝算法。首先,根据特征信息较为丰富和权重信息受数据噪声影响低的特点,分别以特征间相关性和权重熵来评估滤波器的相对和绝对重要性。然后,将每层中不同压缩比例的滤波器看作一个整体,评估其对模型的全局重要性,按照压缩需求跨层剪掉模型中最不重要的部分。实验结果表明,通过多源信息可以更精确的评估单层中滤波器的重要性,通过跨层剪枝可以使模型的关键信息损失降到最低。所提方案不仅适用于多种结构的语义分割网络,对图像分类模型也同样有效。
其他文献
随着现代社会科学技术的飞速进步,为了满足人们日益增长的信息需求,研究一种新型大容量通信技术已成为当前通信领域的研究热点之一。涡旋光束由于其本身携带轨道角动量(Orbital Angular Momentum,OAM),且携带不同OAM的涡旋光束之间相互正交,因此可作为扩充信道传输容量的信息载体应用到光通信领域。目前,基于OAM的新型光通信技术已成为自由空间光通信领域的热门研究方向之一。对于一套高效
学位
合成孔径雷达(Synthetic Aperture Radar,SAR)由于其出色的性能和广泛的应用,自诞生以来得到了广泛的关注。SAR在深度上和广度上不断地发展,分辨率和成像范围不断地提高,出现了多种工作模式以及新颖的成像算法。广域检测是SAR技术发展追求的目标之一,传统的广域目标检测系统中大多采用多普勒波束锐化(Doppler Beam Sharpening,DBS)成像方法,DBS虽然能够大
学位
群体行为识别是计算机视觉领域一项具有挑战性的任务。不同于个体行为,群体行为过程具有复杂的多人关系,发现群体中关键的交互行为具有重要的研究价值。群体中个体的行为具有多样性,特征信息复杂。群体的交互行为具有时间动态性,交互信息难以获取。本文在总结现有群体行为识别方法的基础上,考虑到个体行为的多样性和群体行为的时间动态性,主要解决了群体行为识别任务中以下几个问题:第一,在个体特征信息复杂的情况下,如何实
学位
深度学习作为人工智能领域的主要技术,已成功应用于解决各种二维图像处理问题,但由于二维图像的局限性,难以完成复杂的场景分析。近年来,3D采集技术飞速发展,3D数据越来越容易得到,点云作为三维数据的典型代表不仅包含目标的空间位置信息,也包含目标的几何结构信息,相对二维图像有着天然的优势。鉴于深度学习技术强大的特征提取能力,使用深度学习方法处理点云成为了当下的研究热点,但由于点云是一组离散点集,具有无序
学位
传统电磁波资源如频率、相位、极化等属性已经得到了人们的有效利用。近年来,研究人员发现电磁波的另一种属性——轨道角动量(Orbital Angular Momentum,OAM)也能用于信息传输。同时,携带轨道角动量的涡旋电磁波的旋转多普勒效应可以有效检测目标的角向运动信息,在雷达目标检测领域具有广阔的应用前景。本文研究了基于涡旋电磁波实现目标三维运动信息测量机理,主要研究内容分为以下几点:(1)提
学位
清晰水下图像对于人类水下活动的开展十分重要,然而光在水中传输时会受到水体和水中微粒的吸收和散射作用,造成成像模糊和色差,为提高水下图像质量,本文开展了基于水下成像模型的图像复原方法研究。本文系统总结了自然水体的光传输模型,并拓展得到传统水下成像模型表达。为复原水下图像,首先提出了基于传统水下成像模型的图像复原方法,通过反演水体衰减系数完成图像复原;之后构建相机空间下的宽波段水下成像模型,针对现有研
学位
图像生成的目标是根据特定需求生成期望的图像,是计算机视觉中非常重要的研究主题。广义的说来,凡是生成新的图像内容的相关问题都可以归为图像生成问题。图像风格化就是一种特殊的图像生成,它是指将一张具有艺术风格图像的风格渲染到内容图像上,使得生成的图像不仅能保留内容图像的语义信息而且具备风格图像的艺术风格。在众多类型的图像中,文字图像作为抽象概念的重要载体,在日常生活中十分常见,是重要的信息元素之一。艺术
学位
在过去的数十年里,二维拓扑光子晶体作为一种新型电磁材料逐渐开始被应用于光通信等领域。近年来,学者们研究发现其在调控光子行为时展现出的优越性能,包括光学信号传输时的鲁棒性等。然而此类研究目前仍处于初始阶段,拓扑光子晶体许多卓越的物理特性亟待应用于包括非线性光学在内的光学信息处理中。我们发现了拓扑光子晶体对光子的强局域性可以增强光子之间的耦合效率,并且在此基础上,探究了二维非线性材料AlGaAs制造的
学位
图像超分辨率旨在从观测的低分辨率图像重建出清晰的高分辨率图像,是计算机视觉领域中最经典的图像重建任务之一。清晰的高分辨率图像不仅可以直接用于实际生活中,还能给计算机视觉的其他任务提供帮助,例如,目标检测,语义分割。近年来,卷积神经网络在单帧图像超分辨率领域取得了显著的进步,但是现有的图像超分辨率模型大多只考虑如何充分利用训练集中固有的静态特性,却忽视了低分辨率图像的自相似特征。鉴于此,本文提出的方
学位
随着现代科技步入人工智能新时代,数据总量呈现出爆炸式的增长,数据类型也越来越多元化。作为数据因果发现的重要一环,因果结构学习领域向来备受关注。然而,目前大多数因果结构学习算法难以应对复杂的非线性数据,特别是高维大数据,普遍存在计算复杂度大、结果精确度低等问题。究其原因,缺乏相应有效的独立性分析是重要影响因素。本文以此为切入点,构建了一种空间坐标SC系数和条件坐标CSC系数,一方面,将其与贝叶斯网络
学位