自然场景下的深度人脸识别方法

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:d517441645
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景下的人脸识别面临环境光照、人脸表情、杂乱背景、相机质量、遮挡和年龄等多种因素干扰的问题。本文采用了机器学习领域的深度学习算法,构造出了多种深度卷积神经网络结构进行自然场景下的人脸识别研究。不同于大多数传统算法在自然场景下识别效果锐减的情况,在公开最大的自然场景人脸数据测试集LFW上取得了较好且稳健的识别效果,验证了深度学习在人脸识别领域的价值。本文将深度学习应用于自然场景人脸识别的主要工作内容如下:1、基于卷积神经网络前向传递和随机梯度下降的后向传递算法,设计了深度卷积神经网络结构,训练中引入了mini-batch技术,使得模型能够在CASIAWebFace这样的大型人脸数据库上训练,并在训练阶段,对已有的人脸库做了数据增强和预处理工作。在每个卷积层-池化层模块中引入了级联交叉参数通道池化层结构,构造了更深的卷积神经网络,得到了识别能力更强的神经网络模型。在传统的sigmoid,Relu非线性激活函数上进行改进得到PRelu激活函数。2、在多分支卷积神经网络的基础上,针对自然场景下人脸图像具有更多干扰的问题,设计了最大特征输出层结构;在单一卷积-池化型模块的输出维度不变的情况下,在模块中的隐藏层增加了卷积层通道宽度。在自然场景测试数据库中,该算法的识别效果得到了提升,同时提高了模型稳健程度。3、针对自然场景下个体类别数很大的情况,对传统的Softmax损失代价函数做出改进,增加了关于全连接层特征输出的类内和类间距离度量学习,利用梯度下降学习的特点,设计了类中心的更新方法,并在不同层次的全连接层融合度量学习方法。在深度学习数据驱动的基础上,从自然场景下的数据分布结合深度学习的训练方式入手,进一步改进了类内和类间度量学习,提升了模型识别效果。
其他文献
视频监控技术在安全领域发挥着重要作用,以其直观、方便和信息内容丰富而广泛应用于城市交通、民用安全等各个领域,特别是重要安全部门或重大事件中。伴随移动通信技术的快速发
脑肿瘤分割是一种从灰质、白质和脑脊液等正常的脑组织中,分离水肿、活跃和肿瘤坏死组织等不同的脑肿瘤结构的一种脑肿瘤辅助诊断技术。由于肿瘤在颅内产生,只能通过非侵入式
超短波通信具有抗干扰性能好、传输距离远、安全性高等优点,因此超短波电台广泛应用于战场环境、灾难救助,野外科考、临时会议以及协同合作等特殊场合。在实际应用场景中,通常是
高频地波雷达是一种利用高频波段垂直极化电磁波沿海面绕射的特性而设计出来的一种既可以进行海面目标检测又可以从事海态遥感的设备。目前电离层杂波干扰抑制是高频地波雷达
视觉目标跟踪作为计算机视觉的重要研究课题,具有十分重要的科研价值。而其又作为智能监控、运动识别、人机交互等智能化得以实施的基础性技术,在实际应用上也具有非凡的意义
近年来,基于内容的音乐声纹检索成为研究的热点。它的主要优点在于从音乐信号自身的特征出发,能够在不知道音乐信号的文本信息的情况下,快速找到音乐相关信息,有着巨大的应用空间
作为我国支柱型能源产业——煤炭企业要想在信息化的时代获得新的发展就必须在全行业范围内大力发展信息技术平台的建设与应用。同时,面对竞争越来越激烈的市场,高效、科学的物
三维重建是指利用计算机等辅助设备对空间物体建立数学模型的过程,它是通过计算机对其进行操作、处理和性能分析的基础,同时也是虚拟现实的关键技术。目前,三维形状的获取已
图像压缩是信息处理领域中很重要的研究方向,在图像存储和图像传输等方面都有着广泛的应用。目前存在着很多图像压缩的方法,主要包含基于预测的压缩方法和基于变换的压缩方法。
语音信号处理技术的相关应用越来越广泛,许多新的产品对信号处理的结果要求日益增高。盲声源分离算法在语音信号的提取和识别过程中有着不可替代的作用。盲语音信号混合的方