基于深度学习的视频人脸识别方法

被引量 : 0次 | 上传用户:tywuyaohuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文的视频人脸检测识别方法的基本设计思想是,在给出一段视频文件以及这个视频文件的字幕和剧本之后,可以自动的对视频中的人物进行检测和识别,不需要任何的训练样本。视频人脸检测识别方法主要由四个部分组成:字幕剧本融合部分,人脸检测部分,样本集自动生成部分和基于深度学习的人脸识别部分。本文将深度学习算法引入到了视频人脸识别中来,有两方面的重要意义,一方面,视频人脸的识别要求算法具备一定的抗干扰能力,并且能够保证一定的实时性,本文的实验与分析表明,深度学习算法具备这方面的要求;另一方面,从深度学习算法特性的角度来说,深度学习算法最大的缺点就是构造深度模型需要大量的样本,这很大程度上限制了深度学习算法的应用,然而本文所设计的基于视频的人脸检测模块可以轻松的产生数万、数十万的样本,从而满足了深度学习算法的大样本集要求。基于深度学习模型的人脸识别部分是整个系统的重点,这一部分主要有两方面的意义:一,经历了视频人脸的检测部分之后,虽然视频人脸集合中人脸的纯度有了很大的提升,但是依然会存在一些杂质,因此必须通过识别模块来进一步的过滤掉人脸集合中的杂质;二,通过视频所得到的帧文件中,经常会出现多张人脸同时出现的情况,在这种情况下,视频人脸的检测部分是无法将说话者与人脸进行对应的,必须通过识别模块才能区分出一个帧中的多个人脸。基于深度学习模型的人脸识别部分主要包含三个模块:数据预处理模块、深度学习模块和识别模块。数据预处理模块主要由数据整合和构造数据立方体两个部分组成。深度学习模块通过两个具体过程来实现:RBM调节和深度模型的反馈微调。RBM的调节过程是自下而上的各个层间的调节过程,以这种方式来初始化整个深度模型的系统权值,而深度模型的反馈微调,首先进行自下而上的识别模型转换,然后再进行自上而下的生成模型转换,最后通过不同层次之间的不断调节,使生成模型可以重构出具有较低误差的原样本,这样就得到了此样本的本质特征,即深度模型的最高抽象表示形式。经过深度学习模型的处理,可以得到降维之后的样本特征,在此基础上运用识别模块,本文中所采用的识别方法是人工神经网络的识别方法。
其他文献
中考命题与课程标准的一致性仍有进一步提升的空间。我们的研究表明,省级命题和市级命题之间,不同地区的命题质量之间存在一定差异;有的试卷在记忆水平上所占比率过大,偏重机
<正> 引言激光技术和全息照相的发展提供了建立新型存储装置的可能性,这些装置按效率来说,将大大地超过目前所采用的装置。这种可能性的实现已经在近几年中提高了计算机的效
目的:评估宁养医疗服务前后晚期肿瘤患者的生活品质,为宁养医护人员实施医疗干预、有效改善患者生活质量提供依据。方法:691例接受宁养服务的晚期肿瘤患者自愿完成问卷调查,
中枢神经系统感染(Infections of Central Nervous System,ICNS)疾病是临床常见病及多发病。其中最常见的有结核性脑膜炎、化脓性脑膜炎及病毒性脑膜脑炎,此外,近年来隐球菌性脑膜
项目式学习法在高中信息技术教育中的应用,充分凸显其应用优势,为学生带来更加广阔的探索空间,发挥学生主体作用,在自主思考的过程中,熟练掌握所学理论知识,强化探究能力,促
目的:探讨细胞角蛋白19(cytokeratin 19,CK19)和人乳腺珠蛋白(human mammaglobin,hMAM)在检测乳腺癌外周血循环肿瘤细胞(circulating tumor cells,CTCs)中的临床价值。方法:
<正>实践案例在调查基础上所作的学情分析实际上是发现学生问题的过程。发现学生学习中存在的问题,在教学中寻找恰当的教学策略解决学生的问题,这就是学情分析与教学设计有效
城市形象,一般而言,是城市或城市内的特定区域给人的印象和感受。“城市形象”正在越来越多的出现在人们的生活和城市的发展建设中。随着城市形象这一概念的扩展和丰富,许多的城
【研究背景及目的】肺癌是呼吸系统最常见的恶性肿瘤,其发病率和死亡率在世界范围内居高不下,特别是在我国大中城市呈现逐年上升趋势。临床上所采用的手术、放疗、化疗、微波局
计量校准是量值传递与溯源的最重要手段,测量不确定度是评价计量校准质量的重要指标,科学合理进行计量校准结果的不确定度评定,对保证计量校准结果的准确可靠至关重要。目前我国