论文部分内容阅读
人类视觉系统能够高度适应具有不同属性(光照、天气等)的复杂场景,自适应地调整适当动态范围感知场景内容和细粒度地感知场景细节信息。同样,赋予摄像机系统类人的场景感知能力至关重要。具有精确像素级高分辨率场景感知能力的视觉感知模型有助于提高智能系统(例如自动驾驶)在复杂环境下的场景级理解、推理和决策方面的能力。然而,受限于成像系统感光元件和外部条件(例如光照、天气),复杂环境下的场景内容和细节信息往往无法被当前成像系统精确地记录和表示。本文针对自然图像内容和细节增强问题进行研究,分析了图像成像系统内外部的典型降质因素(分辨率,曝光时间,环境光照信息和噪声),挖掘了场景/任务相关的物理先验知识(包括:图像局部平滑先验、高动态范围编码先验、噪声分布先验、雨纹强度先验),探索了一系列基于物理先验的图像增强模型,解释了场景先验知识在深度增强模型中的有效性,并在相应的底层视觉任务上进行了模型验证。本文第2章首先研究分辨率增强问题。由于摄像机使用离散像素来记录场景辐照度,因此远处的场景物体往往无法得到足够的分辨率表示。受限于图像类型的多样性以及实际应用(例如目标识别)内在要求的实时速度,现有超分辨率算法难以同时兼顾精度和推断效率。本章首先探讨基于神经网络和传统基于图像小块的超分辨率算法的优缺点,并表明这些方法可以相互补充和整合,以同时平衡重建质量和时间成本。基于此,本章进一步提出了一个集成框架,以神经网络和流形算法的结果作为输入,并使用高斯条件随机场学习输入和重建结果之间的像素级映射。实验表明所建立的像素级映射非常灵活,可适应不同的放大因子。实验结果进一步表明所提出的框架在保证推断高效的同时也具有优异的图像重建性能。接下来,本文第3章研究曝光不足/曝光过度区域中的场景内容修复问题。本章首先回顾图像形成过程,并注意到这些区域中缺失的细节存在于相应的高动态范围(HDR)数据中。这些细节被人眼很好地感知,但由于色调映射过程而丢失在低动态范围域(LDR)中。因此,本章工作将图像校正任务转化为HDR转换过程,并提出了 一种深度往复式高/低动态范围域转换的图像校正方法。给定输入的LDR图像,该方法首先在HDR域中重建缺失的细节,然后对预测的HDR数据执行色调映射,以生成恢复细节的输出LDR图像。基于此,本章提出了一个由两个CNN组成的统一框架,以分别用于HDR重建和色调映射两个子任务。它们以端到端的方式训练和预测。在标准测试集上的实验表明所提出的方法相对于最新的图像校正方法具有良好的性能。本文第4章进一步研究低光照条件下的光照增强问题。夜间或背光条件下图像拍摄通常会遇到两个问题。首先,低光图像具有较低的可见性(即小像素值)。其次,低信噪比使得噪声变得显著,进一步破坏了图像内容。然而,现有的低光图像增强方法主要从可忽略噪声的数据集中学习。这些数据集依靠用户具有良好的摄影技巧,以拍摄低噪声的低光图像。因此这些数据集无法提供真实低光环境下的噪声信息。另一方面,同时消除噪声并增强低光图像细节是不适定的。本章首先观察到噪声在不同的图像频率层中表现出不同的对比度水平,这使得在低频层中检测并去除噪声比在高频层中更有效。基于此,本章提出了一种基于频率分解引导的图像增强模型和一个有效的深度神经网络。所提出的模型首先在低频层中去除噪声、修复图像物体的内容和颜色,其次通过修复之后的图像对象引导修复高频细节。此外,本章还构建了一个具有真实噪声的低光照图像数据集以用于网络训练。实验表明所提出的算法在增强真实低光照图像上具有优异的性能。最后,本文第5章研究噪声下的细节增强问题。条状雨纹噪声可以显著降低图像的视觉质量,遮挡物体结构和细节,并消除其颜色。然而,现有的去雨方法主要基于对雨纹的视觉外观或其物理特性(例如雨向和密度)进行建模,因此存在两个常见问题。首先,由于雨纹的随机物理性质,现有方法往往无法正确识别雨纹,进而错误地删除了图像结构和细节。其次,现有的算法无法恢复在大雨中被消除的物体颜色。本章工作从三个方面解决这两个问题。首先,提出一个新颖的网络模块,以充分利用深度神经网络的冗余内容空间和层次内容信息,用于对不同形状大小的雨纹内容进行建模。其次,提出一个新颖的雨纹去除网络框架,包括雨纹检测、物体的结构/颜色恢复和物体细节增强三个步骤。通过深入挖掘环境自身内容与雨纹在特征空间中的不一致性,以达到在图像空间中解耦环境内容与雨纹的目的,进而增强图像对场景内容的表达能力。最后,本章构建了一个新的数据集,并提出了一种新的损失函数以引入去雨过程中语义和颜色的正则。实验表明所提出的算法在视觉质量、定量精度和运行速度方面均取得了优异的性能。