基于卷积神经网络的人脸表情识别研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:nkivy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸表情识别是当前模式识别、人工智能、机器视觉领域的一个热点研究课题,在医疗、教育、交通安全、人机交互等领域有着广泛的应用,具有重要的研究价值和商业前景。但是人脸表情识别也具备一定的研究难度,原因在于人脸表情的区分界限比较模糊,往往面部某一部分的细微变化就足以改变一个表情类别,同时光照、姿态、背景、遮挡等等因素也会增加识别难度。近些年来深度卷积神经网络在大规模物体识别领域取得了巨大的成功,152层的残差网络在ImageNet数据库上取得了高达96.43%的识别率,说明深层次卷积网络在经过训练以后可以具备惊人的识别能力。随着残差学习等一系列研究方法的提出,深度卷积网络的训练也逐步成为可能。本文通过大量实验,比较了各种不同的卷积网络在人脸表情识别上的优劣性,并在网络结构上进行改进,提出了一种能够识别人脸表情序列的多层次卷积网络。本文的主要工作有:1、介绍了人脸表情识别的研究意义和应用前景,概述了人脸表情识别及卷积神经网络的国内外研究现状。详细介绍了卷积神经网络方法的算法原理和结构特点,并对深度卷积网络AlexNet、VGGNet和ResNet进行了剖析,描述了其在训练过程中所遇到的问题以及采取的解决方法。2、对浅层卷积网络、VGG网络和残差网络在结构上进行改进,使之能够适用于人脸表情识别。构造的浅层网络一共含有6层;VGG网络采用了9层、11层和16层的配置进行实验;残差网络则分别设计了20层、32层和50层残差进行对比实验。实验在Fer2013数据集上进行,该数据集含有28000多张训练图片和7000多张测试图片,为了增加训练集图片数量,在原有数据集上进行旋转、模糊等处理以生成扩展数据集。实验中使用含冲量的随机梯度下降算法对网络进行训练,在训练的过程中,训练参数的调节对识别率的提升起着至关重要的作用,本文通过大量尝试,反复地对训练参数进行微调,使得网络的学习最终可以朝着一个比较好的方向进行。本文不仅在Fer2013的测试集上进行了准确率的测试,为了验证训练好的网络在其他数据集上的有效性,还利用Jaffe人脸表情数据库进行了检验。3、本文运用一种多网络融合技术,构建出了能够识别表情序列的多层次卷积网络。首先生成同一个卷积神经网络的多个副本,使每一个副本处理一帧图片;然后将处理结果在融合层进行合并处理;最后通过Softmax层输出识别结果。实验在CK+人脸表情数据库上进行,在训练网络之前,还需要对图片进行一系列的预处理工序,包括人脸检测、尺度归一化和灰度均衡化灰。本文分别取3帧、4帧和5帧表情序列进行了对比实验,取得的最终识别率分别为92.15%、92.24%和92.88%。
其他文献
作为小学一项基础性课程,数学课程对学生逻辑思维和思考能力的提升有非常大的帮助,能够促使学生形成良好的数学学习习惯。但就我国当前小学数学教学现状来看,仍存在一些不容
<正>人物筒介黄有维,中国美术家协会会员。1965年出生于湖南岳阳,1989年毕业于湖南省郴州师专美术系。他的水彩画作品具有鲜明的艺术风格,高难度的艺术技巧,在艺术上取得了巨
论市场经济体制下的内部审计的地位和作用郭大垲目前,对内部审计存在各种各样的看法:有人认为"经济要上,审计要让"、"内部审计不仅不能为企业创造效益,反而有碍企业的开放与搞活"、"内
微电影作为一种微型电影,现阶段其正以星火燎原之势不断涌入到人们的生活之中。微电影短小精悍,却不简陋,其从实践形态和社会价值角度可将其分为公益广告、商业广告、以及艺
<正>全盆腔脏器切除手术是外科最大手术之一,主要适用于直肠癌侵犯膀胱、前列腺、尿道、子宫及其它盆腔恶性肿瘤广泛侵犯及盆腔恶性肿瘤复发二次手术的病人。其切除范围包括:
会议
随着网络购物市场的快速发展及信用评价在网购中日益发挥的重要作用,网络刷单行为相伴而生,成为危害网络市场秩序的主要问题。$$刷单的操作模式$$平台卖家与刷单主持人联系,谈妥
报纸
全盆腔脏器联合半骨盆切除治疗局部进展期直肠癌万远廉,刘玉村,马忠泰,方志伟患者男,33岁。因直肠癌行Miles术后3年,骶、会阴部及右下肢进行性疼痛9个月,诊断为直肠癌复发,于1994年7月28日入院。患者
介绍了国内聚氯乙烯生产过程中母液水处理、回用的方法。经过综合利用,解决了母液水处理困难、回用率低等问题,达到了HJ476-2009的要求。
影像以及网络,正在构成另一种不同于印刷时代的"想象共同体"——这是跨越民族和国家的边界、一种基于虚构的、非地理学意义上的疆域重构,是在影像的感性、理性和神性(spirit)