【摘 要】
:
图像去雾是常见的像素级视觉任务,也是典型的不适定问题。其目的是去除给定有雾图像中的雾气,恢复出清晰无雾图像。基于深度学习的图像去雾依据是否参照大气散射模型,分为间接算法和直接算法。直接算法常利用编解码网络直接学习有雾到无雾图像的映射模型。本文针对现有数据集样本量小,包含场景复杂度低,以及编解码网络信息丢失和网络模型表达能力弱的问题,从迁移特征的学习、多层次特征的融合、网络结构及损失函数的设计进行研
论文部分内容阅读
图像去雾是常见的像素级视觉任务,也是典型的不适定问题。其目的是去除给定有雾图像中的雾气,恢复出清晰无雾图像。基于深度学习的图像去雾依据是否参照大气散射模型,分为间接算法和直接算法。直接算法常利用编解码网络直接学习有雾到无雾图像的映射模型。本文针对现有数据集样本量小,包含场景复杂度低,以及编解码网络信息丢失和网络模型表达能力弱的问题,从迁移特征的学习、多层次特征的融合、网络结构及损失函数的设计进行研究,使恢复的图像更加自然,边缘细节更清晰。本文的主要工作如下:(1)提出基于迁移特征融合的图像去雾算法。现有的图像去雾数据集包含的场景复杂度低,训练的模型处理复杂场景的有雾图像时泛化能力低。因此基于迁移学习思想,在不扩充数据集的情况下,使用在Image Net上预训练的Dense Net169模型提取自然图像的共性特征。对4层不同尺度的迁移特征联合原始有雾图像进行特征融合,既利用了迁移的多尺度特征,又利用原始有雾图像对迁移特征进行去雾适应性指导。(2)提出不同层次的特征融合模块。基于注意力机制的自适应融合多尺度特征模块,提升模型利用跨领域特征的能力。设计门控选取模块,自适应选取不同层次的转换特征,让解码器的输入特征有灵活表示能力。考虑到解码器各层重建细节时忽略边缘特异性的问题,引入并联的多感受野卷积模块,增强各层特征图。将这些模块嵌入基于迁移特征融合的图像去雾算法,使得恢复出的图像无论在局部细节上还是整体观感上都更接近清晰无雾图像。(3)提出基于高频细节增强的图像去雾算法。随着空间维度的压缩,编解码网络的编码阶段不可避免会引起图像空间信息的丢失;在连接编码和解码的特征转换阶段,如何设计网络的结构以增强网络的转化表达及建模能力也是需要解决的问题。针对以上两个问题,首先以输出编解码网络各层特征图的方式,分析了各个阶段各层特征图的特点;然后在编码阶段采用动态卷积和普通卷积融合的方式缓解空间信息丢失的问题;将特征转换阶段分为不同结构的3个模块,设计不同的组件进行消融实验。选择10个普通残差块构建第1个子模块,设计并分别使用15个串行多感知残差组件构建第2和第3个子模块,用以增强模型处理细节信息时的表达能力。(4)在损失函数中引入频率域损失,从频率域的角度考虑去雾图像和清晰图像的差异。训练网络时从像素级、特征级、频率级三个方面最小化损失函数。从多角度训练网络模型,提升模型处理细节信息的能力。在合成和真实的有雾数据集上进行训练和测试,和当今的主流去雾算法作定性和定量的对比,验证了本文所提算法的有效性和先进性。
其他文献
近年来,由于社会工业化进程加快,大量的抗生素以及有机污染物被排放到周围环境中。抗生素由于生物毒性大、成分复杂、色度高、难溶物质含量多和生物降解性差而难以处理,对人类健康和生态平衡造成严重威胁。因此,迫切需要开发一种高效的水体净化技术来处理抗生素废水。传统的光催化剂存在表面活性位点少、只对部分波长范围的光产生响应、光生电子空穴不易分离以及催化活性低等缺陷,而Z型异质结可以降低光生载流子的复合﹑扩大半
小样本图像分类的主要目的在于学习一个具有良好泛化性能的分类模型,该模型在未见过的图像类别上仅需使用少量有标签样本进行学习,就可以取得良好的分类效果。这在现实中有着十分重要的应用价值,一方面,有些类别的样本数量十分稀少,获取难度较大,另一方面,对于有些样本而言,标注成本往往很高。因此,在标注样本数量很少的情况下,研究如何提升模型的分类性能有着极其重要的作用。在基于小样本学习的图像分类任务中,提取出更
肝脏超声造影是一种针对肝癌早期筛查的医学影像技术,然而在超声造影检查过程中,由于患者存在呼吸运动,影响了造影量化诊断参数获取的准确性,从而导致诊断结果可能出现偏差。因此,开展肝脏超声造影序列图像呼吸运动校正技术研究,探究有效的呼吸运动校正技术,对提高超声造影量化诊断参数获取的准确性,促进超声造影量化诊断技术的发展具有重要意义。本文针对肝脏超声造影检查过程中受呼吸运动影响,致使造影量化诊断参数获取准
现代工业中排放的染料废水和含铬废水具有毒性、致畸性和致癌性等严重危害,对生态平衡和人类健康构成严重威胁。因此,寻找能够快速有效并且廉价的吸附去除废水中污染物的吸附剂是人类社会可持续发展的关键。壳聚糖是一种广泛存在且廉价易得的生物大分子,且含有大量的氨基和羟基,能有效对污染物进行吸附。采用合适的制备技术、交联方式和修饰方法能有效提高壳聚糖材料的机械强度、可回收性能、吸附容量和选择性吸附性能。在本研究
作为上世纪发展起来的新型飞行器,直升机被广泛应用于军事、救灾、旅游等各个领域。随着直升机在各领域应用更加广泛,直升机的安全性也变得愈发重要。桨毂作为直升机旋翼系统的核心部件之一,在直升机长时间飞行状态下,桨毂会由于长期受力而产生疲劳裂纹,若没有及时发现裂纹,将直接影响旋翼系统的正常工作进而影响直升机飞行安全。近些年来,利用声发射检测技术对直升机部件产生的疲劳裂纹进行检测并进行裂纹状态识别,能在很大
红外传感器可以根据物体的热辐射效应得到红外图像,并且红外传感器工作在全天候,不受外界环境的干扰,但不能细腻地显示目标的轮廓和背景信息;相比之下,可见光传感器在纹理细节方面具有较高的空间识别度,符合人类视觉系统的感知,但无法显著性地突出目标。因此,整合多源图像的优势信息到单幅图像以便更细致地描述同一场景中每个物体的特征信息已经成为一个研究热点。在此背景下,由于红外与可见光图像融合研究不断深入,该项技
机载视景系统是飞行控制系统的重要组成部分,具有直观、生动的信息传递方式,能够有效的降低飞行员的驾驶负担。同时凭借其实时视景画面,能够在退化视觉环境(Degraded Visual Environment,DVE)下具有同可视条件下相同的操作效率,从而为机组的飞行安全提供额外的保障。因此,机载视景系统具有非常重要的研究意义。本文对基于OpenGL es的机载视景系统进行研究,设计了基于IMX6Q与V
立体视觉标定是获得三维空间点与成像像素点之间对应关系的过程。如今,立体视觉测量系统正广泛应用于大视场环境下大型工件的测量(例如:直升机旋翼桨叶运动参数测量中,桨叶直径长达4.2m)。立体视觉标定作为立体视觉测量的核心步骤,其精度直接影响测量系统的性能。汇聚型双目立体视觉系统具有公共视场大、摄像机摆放灵活等特点,更容易满足大视场环境下高精度测量的需求。因此,大视场环境下的汇聚型双目立体视觉标定技术具
经直肠超声(Trans Rectal Ultra Sound,TRUS)穿刺手术是检测前列腺是否癌变的重要技术,该技术通过手术中实时2D TRUS图像与术前3D TRUS图像的空间位置关系,来快速定位前列腺中疑似癌变的组织或细胞。但是对患者进行穿刺手术时,由于采用局部麻醉,存在患者无法缓解不适而发生的身体运动,以及TRUS探头对前列腺造成挤压等情况,这些情况将导致前列腺运动,致使原本建立的术中实时
本文基于导师团队中标的某航天企业废水处理工程项目,旨在通过实验研究为工程项目提供技术支持,确保顺利验收。介绍了企业的生产工艺和废水来源,以其排放的含磷废水为研究对象,进行现场水质分析,掌握水质特性。对比分析吸附、生物、离子交换、化学除磷、混凝除磷等含磷废水处理方法,针对企业含磷废水特点,结合实际生产需要,选择化学除磷+混凝除磷的方法。采用单因素实验法,从pH和投加量两个角度,通过对比三种化学除磷剂