基于注意力的单图像去雾研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:shaojj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在雾霾天气下获得图像的质量大幅降低,空气中的水汽,悬浮颗粒物等直接影响到相机成像的效果,使得雾霾天气获得的图像不能直接应用于许多计算机视觉任务。另外一方面雾霾天气下获得的图片质量下降,影响到了照片的观感。因此如何降低雾霾对图像的影响,提高雾霾天气下获得图像的质量是具有重要应用价值的研究。本文利用结合注意力的深度学习技术对单幅图像去雾进行了较为深入的研究,并且取得了一些研究成果。主要的工作如下:(1)在图像像素域上研究了去雾。具体的,设计了两种基于注意力机制的卷积神经网络在合成数据集上学习如何去雾。其中基于注意力的分层次密集连接去雾网络主要是受Dense Net的启发,并且为了克服Denseblock只能利用局部先前信息的缺点而引入了不同层级上的密集连接机制。另外为了进一步提升网络的去雾性能,本文在网络的基本块中引入了卷积注意力机制。最后为了更好的融合网络主干上的特征,本文引入了多尺度上的特征融合机制。另外一种基于多尺度卷积注意力的去雾网络一方面简化了上述网络结构,还对上述网络的注意力模块和多尺度的特征融合模块进行了改进。实验结果证明本文提出的两种像素域上的去雾网络都能够有效的进行图像去雾,相比于分层次密集连接去雾网络,多尺度卷积注意力的网络减少了显存的需求的同时进一步提高了去雾性能。(2)研究了在频域上进行图像去雾。首先利用图像的分块离散余弦变换得到图像的DCT系数矩阵,然后按照Zig-Zag编码顺序将系数矩阵划分成低频、中频、高频三个分组,针对不同频率的分组分别使用频域上的去雾网络学习去雾。由于在频域上的三个去雾网络是可以并行推理的,因此该方法的时间复杂度主要取决于计算时间最长的频域去雾网络。(3)由于频域上的去雾网络中低频分量的去雾十分重要,因此本文在低频去雾网络上引入了一种基于暗通道先验的注意力机制。首先利用暗通道先验结合导向滤波估计图像的传输图,由于大气散射模型中的传输图本身就包含空间信息和雾霾浓度信息,并且所有元素值范围在0,1之间。因此本文将其取反加一作为网络的注意力图输入网络。实验结果证明本文提出的基于暗通道注意力的频域去雾网络能够有效的去雾,并且获得色彩自然的去雾图像。
其他文献
与其他学科相比,人工智能(artificial intelligence,AI)的历史并不算长,但是随着时代的发展,AI受到越来越多的关注。AI把人们从繁重的工作中解放出来,人们也乐于应用AI解决复杂的问题。但是提高AI的性能并不是简单地增加图形处理器,人们尝试寻找新的神经网络形态,研究新的学习算法,期望在处理速率以及功耗方面有所突破。脉冲神经网络(spiking neural network,S
学位
梯度折射率(Gradient-index,GRIN)透镜具有渐变的折射率分布,理论上通过控制GRIN器件的折射率分布,可以实现各种奇异电磁特性。然而,现有的GRIN透镜普遍缺乏重组能力,一旦被制造出来就只具有静态功能,这一问题极大限制了GRIN器件的应用。本文着眼于现有GRIN器件设计的不足之处,创造性地提出了全电介质GRIN器件的重组方案,利用一种可插拔结构单元,设计了可任意拼接的超材料透镜。首
学位
目标检测作为人工智能各项研究的基础,在各应用领域发挥着重要的作用,其中遥感图像的目标检测在国防安全建设和民用生产等领域具有着重要意义,但由于遥感图像存在目标分布密集、尺寸差异大、方向多变等特点,现有遥感图像目标检测方法表现并不理想,一直是目标检测领域的难点。因此本文分析了遥感图像的主要特点,选择更加灵活、鲁棒的无锚框算法FCOS作为本文研究遥感图像目标检测的基础网络,设计出适合遥感图像的目标检测算
学位
随着计算机硬件水平的提高以及多媒体通信和三维成像技术的发展,三维点云模型的获取变得更为容易,同时也被广泛应用在虚拟现实、文物保护、自主导航、实时巡检等领域。三维点云是空间中一组无规则分布的离散点集,表达了三维物体或场景的空间结构及纹理属性等信息。为了提升表示精度,点云可以包含百万甚至千万个点,并可附加多种类别的属性信息,导致数据量十分庞大,对现有多媒体系统的存储和传输等环节带来了严峻的挑战,影响了
学位
在工业智能化改革浪潮中,各类企业逐渐向数字化转型,利用热门的人工智能技术和互联网上规模庞大的数据为相关企业和人员提供工业信息查询服务成为企业发展的必然要求。然而现阶段工业领域智能查询系统尚不成熟,许多技术性问题亟待解决。本文研究的基于知识图谱的工业领域问答系统是智能制造中的重要一环,极大地方便了企业进行数据存储、技术查询和内部管理,为企业科学决策、高效运转提供技术支撑。问答系统的构建涉及知识图谱、
学位
吸波材料由于能吸收或减弱表面接收到的电磁波能量,改变电磁波辐射环境,在军事隐身、电磁防护、电磁测试等领域具有不可替代的作用。传统吸波材料具有吸收频带窄、涂层密度大、设计成本高和不可灵活调控等不足,无法满足高效、复合、兼容与智能的实际应用需求。近年来,电磁吸波超表面作为新型隐身材料相较于传统电磁吸波材料,具有重量轻、厚度薄、频带宽、可重构及加工设计简捷等优势,为吸波器设计提供了新的思路。目前可调吸波
学位
无人机、卫星等在获取高分辨率遥感影像过程中,不可避免地存在云层遮挡问题,这对遥感影像应用造成一定程度的干扰,因此云检测技术在遥感图像处理中起着重要作用。由于云的多样性和下垫面的复杂性,目前大多数遥感图像云检测方法仍面临着很大的挑战,尤其是对薄云的漏检及雪与云的误检。同时由于卫星和地面的信息传输的带宽有限,图像需要经过压缩才能在有限的带宽资源下传输到地面,因此提高图像压缩的性能和效率也是迫切需要解决
学位
遥感技术的突飞猛进让如今的国家更加安全、社会更加文明、生活更加便利;从军事领域、土地规划到城市交通、天气灾害预警,遥感技术可谓是渗透到方方面面,人类社会已经高度文明,遥感技术更是充当了“千里眼”的角色。但是在遥感数据的使用上,还是有一些待解决的问题,云就其中最重要的影响之一,它给人类的“千里眼”带上了眼罩,使得遥感图像不能以全貌展示价值。根据测定,地球的表面常年有超过一半的地区被云所笼罩,而这些云
学位
近年来,随着国家“平安城市”等公共安全战略的发展,视频监控系统已经被广泛部署在各个公共场合。然而,即使再周全的视频安防系统仍存在死角,在监控摄像头不可及的角落,仅凭目击者的口述信息在海量数据中追踪嫌疑人仍如大海捞针。因此,能够凭借文本信息在监控视频中智能检索特定行人的技术,即文本属性行人检索技术成为了国内外的研究热点。与传统的基于图像的行人检索技术相比,文本属性行人检索仅需要基于文本的属性信息,如
学位
随着经济发展与技术进步,利用视频监控进行火情检测的方式已被广泛应用于生产生活的各个方面,及时地对早期火灾进行检测能够最大程度上降低其造成的危害。近年来,基于图像处理的火情检测方法因其监控范围广、发生火情可以实时报警和具备高度智能化的特性,成为了当下科研人员的研究热点。但由于火情目标的视觉特征比较复杂,轮廓极不规则,采用传统图像处理的方法难以应对充满干扰的复杂环境,极易出现漏检等情况。深度学习的方法
学位