论文部分内容阅读
目前,在侦破刑事案件时,目击证人对犯罪嫌疑人外貌的描述对于确定嫌疑人身份有很大的帮助。在利用证人或目击者的描述进行查找、确定犯罪嫌疑人时,公安部门设立了专门由每位公民照片组成的数据库,用来确定嫌疑人的外貌特征和身份信息等。但是在实际生活中,由于光线条件差、监控死角或坏掉、抓拍不清晰等各种原因,可能导致很难直接从现实环境中获得嫌疑人的清晰照片。为了克服这个困难,公安部门会请专业的心理素描师根据证词描述进行人物素描绘像,从素描中大致了解嫌疑人的长相。由于素描和照片在纹理、风格表达上有显著的差异,通过素描获取的人脸五官特征还是不如直接看照片清晰,较难获取人脸五官的特征。因此将素描画像合成为照片可以很好的进行人脸识别、身份确定。由此可见,素描向照片的转化具有重要意义。针对在这一问题,本文主要进行了以下工作:1.建立数据库并进行数据加强。选择FERET、CUHK组建数据库。首先进行裁剪,使素描-照片对的分布比例大致相似;之后使用“水平镜像”方法对裁剪后的素描-照片对进行数据增强,将数据库扩大至原数据库的二倍,并将素描-照片压缩至256*256。2.WGAN-GP生成对抗网络及U-NET网络结构构造的生成器。使用WGAN-GP网络可以较好的避免局部最优解和梯度爆炸现象。在设计生成器上,选择了U-NET网络结构,U-NET网络对FCN网络结构进行了改造,完善了扩展路径;此外,U-NET网络是端到端的网络结构,可以直接得到生成图像。本文的生成器损失函数选择了Smooth L1损失函数,该损失函数是L1损失函数和L2损失函数的综合。Smooth L1损失函数限制了梯度不会过大,也不会过小,具有快速生成图片的优点。3.WGAN-GP生成对抗网络及patchGAN网络结构构造的判别器。不是以整个图像当做输入,而是以小的patch来进行的。patchGAN判别器是把生成的图片划分为N*N个patch后,对于每一块分别进行卷积。本文选择patchGAN判别器,利用了其平均所有的响应来提供判别器最终的输出,可生成高质量的结果的特性。WGAN-GP的判别器损失函数采用了WGAN判别器损失函数+梯度惩罚,很好的解决了普通WGAN网络梯度爆炸的问题。最后,本文将研究的方法在FERET、CUHK素描画像-照片数据库中进行神经网络的训练和测试,并与已有的算法进行了结果对比。实验数据证明,本文方法能更加清晰地由素描画像生成照片,生成的照片更加逼真,细节完整且风格明显迥异于素描,有效地提高了人脸识别率。