论文部分内容阅读
近年来,随着社会的飞速发展,人们即将迎来快速发展的智能社会。计算机视觉任务,包括目标检测,目标识别等,将在智能社会中起着重要的作用。行人重识别、去反射以及低光照图片增强作为计算机视觉的子任务,引起越来越多的研究者的关注并逐渐成为相关的热门方向。行人重识别是指跨镜头的行人检索任务,即从同一场景或不同场景中将特定的某个人识别出来,该任务随着现代社会大规模视频监控的应用展现出优越的潜力。在行人重识别这项研究目标中,有着各种各样的具有挑战性的问题,包括视频监控的低分辨率、光照的不一致性、人物的遮挡以及角度的变化等等。由于计算机视觉任务大部分都是基于图片的,而不同环境下采集到的图片质量不一样,使用退化质量的图片往往会严重影响后续子任务的性能。当我们需要透过玻璃去拍摄图片时,采集到的图片往往受到反射严重的干扰,从而导致图片质量下降。现实场景下,反射图与背景图往往都是自然图片,他们都符合同样的分布。因此,从单一的反射图中去得到无反射图(即背景图)是一个病态的问题。现实场景中,有时我们也不可避免的遇到低光照的环境,此时采集到的图片会充满了大量的噪声并产生颜色失真现象。低光照增强是指将这类图片增强得到无噪声的图片。综上所述,本文针对行人重识别、图片去反射与低光增强分别进行了深入研究,并且主要探讨如何使用深度学习技术应用到这些领域。本文主要工作罗列如下:1.提出了一种无监督的行人重识别算法。在目前广泛存在的行人重识别算法中,大部分都是基于有监督的重识别框架。然而,有监督意味着需要大量的标记数据,这将涉及到大量的人力与物力。虽然目前的无监督算法在性能上与有监督算法尚有差距,但其不限地域、不限数据的优势却很明显。因此,我们提出了一种基于软标签和可靠标签的无监督行人重识别算法,他能充分利用所有的数据信息,得到更加鲁棒的特征。2.提出了基于多模态的去反射算法。单幅图的去反射研究往往很难得到理想的效果,主要是因为背景图与反射图都符合自然图片分布,同时已知信息过少。而在实验研究中,我们发现基于Kinect得到的深度图在一定的角度时是对反射鲁棒的,即在特定的角度范围内,深度图可以认为是不受反射影响的。基于此,我们设计了基于深度图与反射图的多模态去反射框架,将深度图作为引导信息进行去反射的任务。在使用公开数据作为训练数据后,为了评测真实场景下的性能,我们同时也拍摄了一组真实场景下的反射图片共205组。3.提出了基于图像梯度的低光照图片增强算法。由于低光照图片往往包含大量的噪声,因此在进行图片恢复过程中,图片的一些细节信息往往会被丢失。我们设计了一种并行的网络结构,在恢复增强图片的同时,学习图片的梯度。将不同尺寸下的梯度信息传递给图片恢复网络,从而得到细节良好的去噪的增强图片。为了保证恢复正确的颜色,我们又设计了一个新的网络去进行颜色信息的恢复。