论文部分内容阅读
近年来,在国防和城市管理等领域,视频监控分析的需求日益增长,例如人脸的检测、验证和识别。然而,受监控摄像头分辨率性能、环境、光照、目标距离等多种因素的影响,监控系统拍摄的人脸影像可能是低质量图像,尤其是远距离的甚低分辨率人脸,继而对人脸检测、识别等任务产生不利影响。因此,研究快速高效的人脸检测和超分辨率方法十分重要。特别地,人脸图像超分辨率也称为人脸幻构,是专注于从低分辨率的监控视频或单幅图像获得高分辨率人脸图像的技术。然而,当处理对象为远距离甚低分辨率人脸,由于缺乏有效的先验知识作为强有力的语义指导,现有大多数人脸幻构方法的重建效果往往急剧下降。为此,本文在深度学习框架下不仅深入研究了甚低分辨率人脸幻构方法,同时探讨了尺度自适应的人脸检测方法。工作要点如下:1.针对大多数现有方法因先验信息不足造成甚低分辨率人脸幻构视觉效果差这个问题,本文构建了基于边界均衡生成对抗网络(Boundary Equilibrium GAN,BEGAN)的甚低分辨率人脸幻构模型tfh-BEGAN。通过引入BEGAN作为隐式人脸先验的基本架构,同时设计包含残差模块和跳跃连接的自编码生成模型,旨在充分挖掘其较强的高分辨率人脸图像生成能力。实验结果表明,上述自编码生成网络是影响tfh-BEGAN人脸幻构性能的关键。但是,受限于BEGAN自身的交替迭代算法限制,tfh-BEGAN存在幻构人脸真实感不强的问题。2.针对tfh-BEGAN重建得到的人脸图像真实感不足,且对抗训练模型交替迭代实现复杂度较高等问题,本文在上文自编码生成模型基础上,引入具有增强图像真实感的上下文损失,提出了基于上下文损失的甚低分辨率人脸幻构方法。实验结果表明,模型重建的人脸在图像生成质量评估标准FID上优势明显,且具有丰富的高频细节和理想的视觉效果。同时,显著增强了低分辨率人脸中的可识别特征,提升了幻构模型对真实低分辨率人脸的适用性。3.针对甚低分辨率人脸信息严重缺失导致检测准确率较大程度降低的问题,本文进一步提出注意力机制引导的尺度自适应人脸检测模型。具体而言,本文以Retina Net目标检测网络为基础架构,通过有效挖掘CBAM(Convolutional Block Attention Module)的空间和通道注意力建模潜能,引导深度网络自动聚焦有助于人脸检测的重要语义特征。在WIDER FACE上的实验结果表明,作为单阶段人脸检测网络,本文方法在只增加少量参数条件下能够显著提高各尺度的人脸检测准确率。