【摘 要】
:
水下图像存在颜色失真、细节模糊、对比度低等问题,直接影响水下目标识别与跟踪等工作,严重影响了计算机视觉系统在海洋研究中发挥效用,水下图像清晰化研究具有重要的理论意义和应用价值。目前基于有监督学习的水下图像复原方法通常需要高质量的清晰图像作为参考,而其在现实的场景中难以获取;使用合成数据作为训练数据集的复原方法则难以适用于真实场景。基于此,论文提出两种基于无监督学习的水下图像复原方法,具体工作如下:
论文部分内容阅读
水下图像存在颜色失真、细节模糊、对比度低等问题,直接影响水下目标识别与跟踪等工作,严重影响了计算机视觉系统在海洋研究中发挥效用,水下图像清晰化研究具有重要的理论意义和应用价值。目前基于有监督学习的水下图像复原方法通常需要高质量的清晰图像作为参考,而其在现实的场景中难以获取;使用合成数据作为训练数据集的复原方法则难以适用于真实场景。基于此,论文提出两种基于无监督学习的水下图像复原方法,具体工作如下:首先,论文基于卷积神经网络,提出了一种零参考单幅水下图像复原方法。网络主体采用基于扩张残差网络的编解码结构,利用残差网络进行特征提取,并将扩张卷积引入残差块,可使其在不降低图像分辨率的前提下增大网络感受野。同时,根据水下图像的降质特点,论文从改善色偏、增强对比度、保持图像内容等方面出发设计了一系列无参考损失函数驱动网络训练过程。实验结果表明,该方法复原得到的水下图像视觉效果理想,并可较好用于真实水下场景。为了在水下图像复原过程中保留更多的图像细节,论文提出了一种基于多层小波网络的无监督水下图像清晰化方法。网络主体采用基于小波变换的编解码结构,它包含一些对称的卷积层和反卷积层,用于学习端到端的数据映射。该网络利用小波变换及其逆变换替代传统的下采样和上采样过程,以保证在特征提取过程中可更好地保持图像的细节。同时,在编码和解码相对应部分加入跳层连接,将浅层和深层特征相融合,实现特征复用,保留更多的高频信息。实验结果表明,该方法复原得到的水下图像细节清晰,颜色自然。
其他文献
当前,随着5G移动网络技术和视觉分析技术的迅速发展,信息获取方式产生了深刻变革,短视频在这样的背景下蓬勃发展,逐渐取代了以文字图片信息为主的信息传播模式。短视频作为多媒体数据具有多模态特性和丰富的语义信息,这些信息由于具有不同模态和维度的特征而具有高阶属性,也伴随着噪声和相关性信息,这给训练模型过程带来了挑战。短视频事件检测任务涉及到多模态信息的交互,充分发掘这种模态相关性并进行多模态融合是事件检
微动作检测也被称为时序动作检测,是视频处理的重要环节。基于深度学习的时序动作检测与识别技术在精度和速度等方面远远超过了传统算法。但是,目前时序动作检测还存在精度低、难以区分动作边界等问题。针对以上问题,本文基于深度学习和卷积神经网络,对已有的编码-解码时序动作检测算法进行了深入的研究,并做出以下三个方面的改进:(1)将原算法中的特征提取网络替换为具有残差结构的深度卷积网络,使整体网络可以提取到更丰
随着电动汽车充电需求的增多,电动汽车用户与多家充电运营商、公用供电企业之间出现了支付复杂、信息不联通的情况。电动出租车所需的充电次数较多,也缺乏能够包含多个充电运营商的充电引导服务,因此本文寻求一种新的充电服务机制以解决上述问题。为了实现充电服务的互联与充电交易的自主管理,本文提出了基于联盟链的电动汽车充电服务机制。该机制采用联盟链构建充电服务模型,通过实用拜占庭容错共识算法验证电动汽车充电交易,
近年来,三维模型分类和检索任务已成为多媒体领域和计算机视觉领域中的一项研究热点。随着深度学习技术的蓬勃发展,各种高性能的深度学习模型被提出并广泛使用。这些深度学习模型关注于不同的三维模型表示形式,例如点云、多视图、全景视图等等,均表现出了卓越的性能。但是,这些方法都忽略了一个重要的信息,即相同的三维模型在不同的模态表示场景下的多模态信息。本文提出了一种创新性的多模态融合网络来解决三维模型数据的分类
三维目标检测是场景理解任务中的基础问题之一,在智能驾驶和机器人感知等领域有着广泛的应用前景。基于不同传感器数据的三维目标检测算法在性能、效率以及应用场景等多个方面均存在差异。能获取精确距离的激光雷达和具有较高分辨率的双目相机常作为主要的感知设备应用于智能驾驶系统。激光雷达通过发射特定波长的激光束并接收目标回波以获取场景的三维点云。当前基于点云的三维目标检测算法存在两个问题。一是在点云的特征提取网络
视频片段检索旨在依据给出的查询信息,在未经剪辑的长视频中检索出与查询内容相关的视频片段。本文的工作使用一段视频作为查询信息,给定查询视频,可以从参考视频中提取出与查询视频具有语义相关性的内容片段,并确定其起止时间。这项技术被称为基于视频查询的视频片段检索。在实际应用中,这项技术可以更智能的为人类提供视频选择,有效地减少用户浏览相关感兴趣视频的时间,还可以应用于视频监控和基于视频的人员重识别任务等其