论文部分内容阅读
随着人民生活水平的显著提高和对美好安全工作和生活环境越来越强烈的需求,视频中动态人脸识别技术受到社会各界的广泛研究和高度关注。由于视频数据中存在着对人脸识别不利的图像,如光照变化、姿态变化、遮挡和图像模糊等原因造成的图像,因此,动态人脸识别成果还处于初级阶段,特别是识别鲁棒性比较糟糕,无法满足实际应用要求。动态人脸识别与静态人脸识别相比具有更高的理论研究意义和实际应用价值。幸运的是,伴随着即将到来的人工智能时代,先进的深度学习技术为解决视频中动态人脸识别问题提供了新的解决方法。本文针对动态人脸识别鲁棒性差的问题提出了一种视频监控环境下动态人脸识别的方法。主要工作及贡献如下:(1)本文方法灵感来自最近一些深度学习技术的启发,设计出一种同时回归和分类的循环网络(Simultaneously Regression and Classification Recurrent Network,SRCRNet)。SRCR-Net结合了迁移学习、多任务学习、增强学习和循环神经网络的优点。采用迁移学习的策略可以减少模型的训练收敛的时间;多任务学习能同时跟踪人脸目标和识别人脸类别,有助于提高动态人脸识别的效果;增强学习加重了人脸关注区域的学习权重,提高了识别准确率;循环神经网络具有一定的记忆信息能力,很适用于视频图像信息,可以提高动态人脸识别的鲁棒性。首先用预先训练好的模型提取视频每一帧的人脸图像特征,然后对其进行同时跟踪和识别,采用增强学习进一步提高识别效果,最后使用循环神经网络对一段视频进行识别。本文提出的网络模型采用线上训练和线下测试的策略,可以提高模型识别人脸的速度,满足了动态人脸识别系统实时性的要求。(2)针对视频监控环境中容易生成不利于人脸检测的图像,本文对传统的Adaboost人脸检测方法进行了改进,在检测前先进行人脸肤色模型创建和人脸肤色亮度泛化模型创建,用于预先定位人脸区域,该方法可以有效缓解图像复杂背景和较强光照变化给人脸识别带来的不利影响。(3)设计实验验证SRCR-Net模型以及它的变形模型,分析了迁移学习、多任务学习、增强学习和循环神经网络对提升动态人脸识别效果的影响;同时,将本文提出的方法与目前先进的方法进行实验对比,根据实验结果表明,本文方法的识别准确性接近最好成绩并且鲁棒性有了较大的提升;本文还实验分析了实验数据分布和大小、使用不同的损失函数和不同层数的长短记忆网络(LSTM)对模型识别结果的影响。(4)对深度学习知识和人脸识别技术进行了概述。简单的介绍了深度学习的相关概念和详细的讲解了深度学习具有特征学习能力的原理,以及重点介绍了卷积神经网络的相关理论知识;总结和分析了基于深度学习的人脸识别方法的优势与发展趋势。为提高社会公共安防能力和有效保障人民生命财产的安全,本文借助当前深度学习发展火热的浪潮,设计出一种适用视频监控下的动态人脸识别方法。该方法一定程度地解决了动态人脸识别的技术难点,特别是有效地提高了动态人脸识别的鲁棒性和实时性。