论文部分内容阅读
数字图像修复技术是指利用图像缺失区域的邻域信息,按照一定的修复规则实现图像修复,使得观察者在视觉上无法感知图像曾经破损或已被修复。该技术被广泛应用于文物复原、视频图像修复、障碍物移除、影视特效制作等众多领域。图像修复中,当涉及图像语义缺失时,基于结构纹理的传统图像修复算法在单源图像中,利用破损区域邻域信息修复的图像无法取得令人满意的效果。本文提出了基于Wasserstein生成式对抗网络的图像修复算法,该算法的创新之处在于从多源相关图像中获取高层次上下文信息,完成图像修复。不仅改善了传统图像修复算法的诸多缺陷,而且使得修复效果明显提升。基于Wasserstein生成式对抗网络的图像修复算法,首先在CelebA数据集上训练Wasserstein生成式对抗网络(WGAN),然后将待修复图像输入WGAN生成一系列与之相似的伪造图像;其次为了从伪造图像集中获取最佳伪造图像,该算法定义了一个由语境损失和感知损失组成的损失函数。其中,语境损失保证待修复图像与修复后图像内容的相似性,感知损失保证视觉上输出完整逼真的图像;最后利用该损失函数的反向传播算法,把待修补图像映射到较小的潜在空间,将映射后的矢量输入WGAN中生成待修补图像的最佳伪造图像,从而实现图像修复。本课题在LFW人脸数据集上实现了面部图像缺失区域高达80%时的修复任务,并通过主观和客观评价标准,证明该方法不仅能够成功预测图像语义缺失,而且能够生成完整逼真的图像。