基于深度残差网络的图像序列人脸表情识别研究

来源 :西安邮电大学 | 被引量 : 0次 | 上传用户:fightwang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机视觉技术的快速发展,人脸表情识别技术逐渐兴起。无论在学术界还是应用在工业界,如何实现人脸表情的自动识别已经成为研究的热门课题。当前人脸表情识别技术存在巨大的发展潜力以及丰富的应用场景,可用于智能人机互动、汽车安全驾驶、辅助医疗和在线教育等场景。到目前为止,大多数人脸表情识别算法的研究对象主要是使用静态表情图像,但是人脸表情变化是一个动态的过程,仅仅使用静态的人脸表情图像不能利用到表情变化的时间和空间特征。图像序列人脸表情相比较静态图像人脸表情可以捕捉到更多的运动特征和纹理特征,这样在进行人脸表情分类时可以提高准确率。本文的主要研究工作和创新点如下:1、分析了输入图像的预处理操作来提高人脸表情的识别率。不同于传统的卷积神经网络直接将检测到人脸的原始图片作为输入,本文算法在输入网络前进行了一系列的图像预处理操作。首先使用了最新准确率较高的人脸检测算法Retina Face提高复杂以及非正脸的识别率,然后使用了基于面部四点的人脸对齐法进行人脸的对齐,接着进行了图像裁剪以及强度归一化,最后使用传统方法提取旋转不变局部二值模式(Local Binary Pattern,LBP)图谱作为最终输入。2、研究了深度残差网络作为骨干网络实现静态人脸表情识别的算法。首先使用一系列的图像预处理操作后得到输入图像的LBP图谱,然后使用LBP图谱作为深度残差网络的输入,最后网络模型经过训练后使用Softmax层进行人脸表情的分类。对比了不同层数的残差网络、不同形式的LBP算子以及其他网络结构等对表情识别的影响,并且在FER2013数据集上进行了实验,结果表明本文算法具有较高的识别率。3、研究了深度残差网络结合长短期记忆(Long Short-Term Memory,LSTM)网络实现图像序列人脸表情识别的算法。首先,将在FER2013数据集训练好的网络作为特征提取器;然后,将图像序列作为一个单位依次提取每一帧特征,接着以向量的形式组合成为表情时序特征;最后,将表情时序特征作为长短期记忆网络的输入来进行人脸表情分类。同时,使用支持向量机算法和随机森林算法进行了图片序列表情识别,并且在Cohn-Kanade数据集和AFEW6.0数据集上进行了验证,与其他图片序列表情识别算法进行了对比,实验结果表明本文算法识别率有一定的提升。
其他文献
本文证明了在二维旋转双层流体内部界面上行进的小振幅孤波的存在性,这里假设该流体深度有限、上下边界均固定且受重力及内界面张力作用。此外,本文还假设流体中无相对静止点
随着各种网络技术的不断发展,移动互联应用覆盖全国各地,然而目前人们对于高带宽移动互联的需求正与日剧增。虽然移动设备具有多个网络接口,但由于传统的TCP传输协议(Transmi
工作流是提供科学实验的常用模型,它由许多任务,数据流和计算依赖性组成。将工作流任务与用于执行的计算资源(VM)映射的过程(保留任务之间的依赖性)被称为工作流调度。工作流
随着“大数据”时代的到来,教育大数据、智慧教育、教育数据挖掘等一系列结合教育学、统计学、计算机科学的概念相继被提出,政府、企业、学校、研究者、管理者、教师、社会公
知识经济时代,知识管理是企业管理活动中极为重要的内容,是企业和团队生存和革新的基础。知识共享是达成知识管理目标的必要手段,随着工作团队逐渐成为各企业的运作单位,团队
目的:对比分析中央型小细胞肺癌(small cell lung cancer,SCLC)和中央型鳞状细胞癌(squamous cell carcinoma,SCC)的18F-FDG PET/CT形态特点和代谢特征,并探讨18F-FDG PET/CT在局
目的:了解运用PDCA管理降低住院抗菌药物使用强度的效果。方法:将我院2015年7月到2016年6月的抗菌药物使用强度作为对照组,该阶段尚未实施PDCA管理,而2016年7月到2016年12月
淋巴瘤是一组异质性的血液肿瘤,弥漫性大B细胞淋巴瘤(DLBCL)是其中常见的一种亚型,约占所有淋巴瘤患者的30-40%。其中活化B细胞样型淋巴瘤(ABC-DLBCL)最容易产生耐药性,因此,
预测推理是机器人模仿人类智能的一项重要能力。近年来计算机视觉领域中的视频预测技术为机器人提供了预测编码的实现手段,使得机器人可以根据少量连续的视频等信息通过图像
数字全息(Digital Holographic,DH)数值重建距离与全息图的记录距离有关[1],由于像差复杂、衍射极限、记录仪器(CCD、CMOS传感器、SLM空间光调制器)分辨率限制以及一些人为实验损