基于深度学习的人脸检测与人脸关键点定位算法研究

来源 :中国计量大学 | 被引量 : 2次 | 上传用户:meiyin1109
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉领域中,对人脸图像进行人脸检测与人脸关键点定位是一项具有重要意义的任务。人脸检测与人脸关键点定位是人脸图像分析的重要基础步骤,视觉场景中进行人脸检测并定位出人脸所在位置,根据人脸检测框图完成对人脸面部重要关键点位置定位,在人脸识别、表情识别、人脸属性分析等任务中有着广泛的应用。深度学习在图像处理问题中具有足够强大的特征提取和特征表达能力,本文采用深度学习方法提升非约束条件下的人脸检测检测率和人脸关键点定位精确度。人脸检测任务中,增加神经网络深度可以进一步提高神经网络对人脸特征的提取能力和非线性函数逼近能力。但是,在构建深度卷积神经网络的过程中出现了梯度消失和梯度爆炸问题,使得神经网络无法通过增加网络深度提高人脸检测器性能。非约束条件下的人脸关键点定位任务中,人脸外观和人脸关键点的位置呈现高度的非线性关系,尤其是在视频监控问题等实际应用中,人脸关键点定位的精确率还需要进一步提高。本论文主要针对人脸检测和人脸关键点定位问题进行研究,并针对以上问题提出了算法的改进,主要内容如下:(1)在人脸检测过程中,针对深度神经网络出现的梯度消失和梯度爆炸问题,本文提出了一种差值网络和二阶差值网络的神经网络微结构。该方法包括:设计可叠加的卷积神经网络微结构,使网络加深的同时避免梯度消失和梯度爆炸问题;采用一阶、二阶的差值方式设计跨越特征层融合更加复杂特征,进一步提高深度神经网络的特征表达能力。实验结果表明:差值网络和二阶差值网络解决了深度神经网络的梯度消失和梯度爆炸问题;通过增加网络深度,提高了神经网络的特征挖掘能力,进一步提升了人脸检测的检测率。另外,该网络结构在目标分类、识别过程中也有良好的表现。(2)针对非约束条件下人脸外观和人脸关键点非线性差异问题,本文仔细分析训练样本数据,有针对性的对公开数据集进行样本增强。丰富了不同场景下样本多样性,提高级联回归神经网络模型在非约束条件下的鲁棒性。同时,本文提出了一种改进的“由粗到精”的级联卷积神经网络结构,该模型包括:通过增加神经网络宽度在全局回归阶段增加多尺度特征融合,增强网络特征学习能力;提出一种针对神经网络回归问题的代价函数,在代价函数中引入一个可学习参数,进一步提升了神经网络解决回归问题的能力。实验结果表明:该网络结构以及相应的回归代价函数有效降低了人脸关键点定位的平均误差,提高了网络模型对非约束条件下人脸关键点定位的精确度,同时提升了神经网络收敛速度。
其他文献
洁净型煤被认为是减少农村冬季采暖污染的有效途径之一,以山东省德州市乐陵市下属的崔家楼村型煤采暖推广示范村为例,通过对山东省德州市政府访谈、入户调研和现场测试等方法
水体的富营养化日益严重,为了减缓这一现象,本文选取黑藻(Hydrilla verticillata)、苦草(Vallisneria natans)和狐尾藻(Myriophyllum verticillatum L.) 3种常见的沉水植物作
让机器人教育走进学校,并将其融入课堂是促进机器人教学的有效途径之一。研究分析了当前我国小学机器人教学的现状,以及建设小学机器人教学微课资源的必要性和可行性。文章通
本文介绍了以安卓手机为载体的智能监控系统,系统具备行车记录、倒车影像/倒车雷达、行车导航、故障监测、图像监控和锁车启动功能,内容涉及系统应用意义、系统设计、系统构
为了充分利用盐湖卤水中丰富的锂资源,提出了以磷酸三丁酯(TBP)-乙酸丁酯(BA)-FeCl3-260#磺化煤油体系协同萃取提锂的方法。针对该体系,考察了卤水酸度、nFe/nLi比以及温度对
对近代汉语三种句式结构内部成分变化现象的分析,可以看出这几种句式结构内部旧成分的隐含、缺失、虚化最终也会引起句式结构的变化、句式语义的根本变化.
水碾是古代中国一种较为先进的农业加工器具。唐朝时,其应用之广泛与纯熟达到一个新高度。唐朝特权阶级为了谋求水碾加工的巨额利润,在河渠之上广设水碾,造成加工用水与农业
<正> 每一位艺术家在他进行创作的时候必然要带上时代的烙印,他的作品不仅是历史更叠、时代演变的“铭文”,也深刻地映现着自己精神追求的烙印。当我们寻绎艺术家相当长一段
《资治通鉴》“投石、超距”虽然源于《史记》,但二者不仅标点有异,各家对它们的认识也是聚讼纷纭。文章基于“投石”、“超距”的文献分布情况,从语言结构规律的角度得出:“投石
目的:了解北京市心理援助热线自杀高危来电特征及干预效果。方法:选取2006年1月至2010年8月拨打北京市心理援助热线的来电,符合高危随访条件来电共856例,其中预约随访来电586例。