残缺人脸图像的修复与识别的研究与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:playlogic
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,卷积神经网络和生成式对抗网络的兴起使得人类在对图像的处理更加具有想象力,对图像编辑、人脸识别、安全验证等领域都发挥了重要作用。图像编辑技术一直是一个热门的话题,传统的图像编辑软件例如Photo Shop等一直受到广泛使用,但是由于一些传统算法的局限性,不能有效地处理残缺的图像。近来,一大批基于深度学习算法的图像修复技术应运而生,极大地克服了传统算法的局限性。然而已有的深度学习算法在应对缺失的图像时产生的结果图往往带有明显的人造痕迹,原因在于直接从三通道RGB图像进行修复会加大修复的不确定性。受到美术领域素描技术和生成式对抗网络的启发,本文考虑先利用轮廓塑形,再对其进行填充,故提出了一个两阶段修复模型用于对残缺人脸图像的修复。在该模型中,第一阶段利用残缺图像的灰度图和掩膜提取出已有的轮廓,经过生成式对抗网络的生成器得到预测的轮廓图;第二阶段利用预测的轮廓图和缺失的原图再生成预测的三通道彩色图像。通过实验从定性和定量两个方面与其他深度学习方法做了对比分析,表明具有更好的效果。由于残缺人脸部分信息的缺失,对其进行识别一直是一个难点,传统的子空间回归、鲁棒误差编码等方法均无法取得令人满意的效果,缺失信息也会对以神经网络为基础的深度学习算法产生特征提取上的困难上。本文为降低缺失区域对识别的影响,提出了对残缺人脸图像的识别的一种解决办法,即先修复缺失部分,再利用余弦相似度代替Face Net中基于欧式距离的三元组损失,并基于权重对比特征向量的相似度进行人脸比对和识别。最后根据需求设计并开发了一款简单的残缺人脸修复识别系统,并对该系统的功能进行了测试,实验结果表明该系统具有比较优秀的准确率。
其他文献
颅内动脉瘤是对人类生命健康危害最大的脑血管疾病之一,其症状不易发现,且发病过程紧急,具有很高的致死、致残率。因此,颅内动脉瘤的前期诊疗十分关键。目前针对颅内动脉瘤的检查方式主要有三种:计算机断层扫描血管造影(Computed Tomography Angiography,CTA)、磁共振血管造影(Magnetic Resonance Angiography,MRA)和数字剪影血管造影(Digita
介于传统微波和光通信之间的太赫兹频段,由于其在成像,传感和通信上的应用潜力正在受到越来越多的关注。在太赫兹频段,由于其高频高传输速率的特点,芯片之间的信息传输交互需求也极大的提升。但是传统的芯片I/O端口由于其带宽、频率以及效率的限制越来越无法满足现有的太赫兹系统的需求,太赫兹频段的片间互连逐渐成为了太赫兹系统的瓶颈之一。高效率,大带宽,较小的带内波动,成为了突破太赫兹片间互连瓶颈的主要难点。太赫
拉曼光谱是研究分子结构的有效手段。拉曼峰强隐含着电子与原子核相互作用的丰富信息。本论文重点以拉曼峰强为分析对象,用由拉曼峰强求取分子键极化率的方法,对吸附在电极表面的分子中的电子行为进行了研究。并提出了一个从拉曼峰强求取键极化率了解拉曼激发虚态电子结构的思路。用表面增强拉曼散射(SERS)实验方法,结合分子简正振动分析与键极化率理论,对单配位异硫氰酸合铬(III)络合物在银电极表面的吸附构型和表面
非经典感受野(Non-classical receptive field,n CRF)对经典感受野(Classical receptive field,CRF)的外周调节(Surround modulation,SM)作用是哺乳动物初级视觉皮层(Primary visual cortex,V1)神经元的基本特性。研究这种调节作用有助于理解视觉皮层对大范围图像信息整合的基本原则。前期对SM的研究,大
帕金森疾病是一种大脑神经退行性疾病,表现为典型的运动症状,如静止性震颤、强直和运动迟缓,以及一些非运动症状,如认知功能障碍、嗅觉障碍等。根据主要的运动症状,帕金森疾病可分为运动迟缓、强直主导亚型(AR)和震颤主导亚型(TD)。临床证据表明,帕金森疾病的不同亚型有不同的病程和预后。事实上,相对于TD亚型,AR亚型的临床进展更快,患痴呆症和其他精神疾病(如抑郁症)的风险更高,这表明帕金森亚型之间的神经
已有研究表明多种认知加工过程和其大脑机制存在性别差异,然而较少研究关注反应抑制的性别差异。反应抑制指在变化的环境中抑制不符合当前需要或者不恰当的占优势行为反应的能力,能够帮助人们对变化的环境做出灵活的、目标指向的行为。本文研究采用结构磁共振和静息态功能磁共振成像方法,采集结构和静息态磁共振成像(magnetic resonance imaging,MRI)数据,采用基于个体差异的方法,研究健康男性
视听多通道语音信息的整合是人类进行语言交流的关键。近年来,视听整合已成为科研工作者们的研究热点。然而,人们对视听多通道语音感知整合中的神经机制尚不完全清楚。随着神经成像技术的发展,特别是磁共振成像技术的广泛应用,为视听多通道语音感知整合机制的研究提供了可靠手段。本文将行为学实验与磁共振成像技术相结合,从任务态到静息态,从功能到结构,多角度对视听多通道语音感知整合机制进行探究。首先,本文基于任务态功
交通场景中的视觉注意预测是帮助理解人类视觉认知过程和设计智能辅助驾驶系统的重要途径。这在自动驾驶、目标搜索等任务中具有重要作用。然而对于夜间交通场景来说,更复杂的光照问题让视觉注意预测面临巨大的挑战。即使对于日间交通场景表现优秀的深度学习类方法,不同光照情况下的鲁棒性也尚未解决,如白天场景到夜间场景。高效的注意分配对于人类视觉系统来说似乎毫不费力,但对计算机来说却如此困难。对此,视觉神经科学领域已
重度抑郁症(Major depressive disorder,MDD)是最常见的情绪障碍之一,在临床上表现为持续的快感不足,情绪低落,认知障碍。虽然已有研究利用磁共振技术对抑郁症大脑结构和功能异常进行探索,并报道了抑郁症在低频振幅(Amplitude of low frequency fluctuation,ALFF)、局部一致性(Regional homogeneity,Reho)等表现出了频
颞叶癫痫(temporal lobe epilepsy,TLE)是一类常见的局灶性癫痫,它是指发作起源于颞叶的癫痫类型,常见于成年人和青少年。在TLE患者中,突发性的意识丧失显著恶化了患者的生活质量,增加了死亡风险。尽管先前的研究已经开始在不同尺度上对癫痫的病理机制进行了研究,但癫痫的发病机制仍然没有得到较好的理解,特别是其脑机制仍不明确。近年来随着神经成像技术和脑网络分析方法的发展,特别是静息态