基于生成对抗网络的多角度面部表情识别研究与实现

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:Viola2007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多角度面部表情识别一直以来都是机器学习和计算机视觉领域的研究难点之一。传统意义上的面部表情识别指的是对正面人脸表情图片进行分类。但是现实中我们获取的人脸表情图片,大多是由不同偏转角度的摄像机所拍摄的多角度人脸表情图片。不同角度的相同面部表情的特征大不相同,使得计算机精确的识别多角度面部表情这项任务更具有挑战性。此外,许多公开的面部表情识别算法对非限制性条件下采集的人脸图像识别效果不佳,说明目前多数表情识别算法离实际应用仍有较大的差距。大多数的表情识别算法只是对标准正脸表情图片通过相关算法进行分类,如果直接将正脸表情识别算法使用在多角度人脸表情识别领域,准确率会极大的降低,因为正脸表情和侧脸表情的特征差异很大。针对上述问题,本文采用基于生成对抗网络的算法来提高多角度面部表情识别的准确率和鲁棒性。其中对于不同角度下采集的人脸表情图片,基于迁移学习的思想,将侧脸表情特征映射到正脸表情特征空间中,并且优化了特征分类的方法。该算法能够很好的学习正脸表情特征和侧脸表情特征之间的映射关系,并且能够从两种角度提取人脸表情的空间特征。算法的有效性在第四章的实验部分得到了充分的验证。本文的研究内容如下:(1)调研了常用的多角度人脸表情识别方法,简述了多角度人脸表情识别和迁移学习之间的关联,并使用基于深度神经网络的算法实现了三种迁移学习领域的实验,证明了生成对抗网络在迁移学习领域应用的可行性;(2)提出了基于条件生成对抗网络的算法来解决多角度人脸表情识别问题。近年来,生成对抗网络在计算机视觉领域取得了巨大的成功,本文将其引入到表情识别领域并取得了不错的效果。为了提高多角度人脸表情识别的准确率,本文使用生成对抗网络的分支——条件生成对抗网络来学习正脸表情特征和侧脸表情特征之间的映射关系,将多种角度的侧脸表情转换为对应的正脸表情,再对得到的正脸表情使用卷积神经网络进行表情分类。该算法运用迁移学习的思想,学习了正脸表情特征到侧脸表情特征的映射关系,相当于将拍摄侧脸表情的摄像机“扳正”,接下来只要进行简单的正脸表情识别即可。本文对使用条件生成对抗网络进行多角度表情识别的系统进行了讨论,主要是以实验的形式展开;(3)提出了结合生成对抗网络和卷积神经网络优点的深度神经网络MVFGAN。将特征映射网络GAN的低层部分与表情判别网络VGG16的高层部分相连接,形成一个判别侧脸表情类别的深度神经网络MVFGAN。由于GAN中的低层部分是侧脸图像到正脸图像的映射,高层部分是对正脸表情图像中表情语义的描述。因此,本方法利用生成对抗网络将多角度侧脸表情识别问题分解为侧脸图像到正脸图像的映射和正脸表情图像的判别。该网络和使用条件生成对抗网络进行多角度表情识别不同的是,不需要中途生成侧脸表情图片所对应的正脸表情图片再使用卷积神经网络进行分类,而是将特征映射和特征分类的两个网络耦合,形成新的端对端的深度神经网络MVFGAN。在使用MVFGAN算法进行多角度面部表情识别的实验之后,鉴于该算法和基于条件生成对抗网络算法的互补性,将两种网络模型融合,进一步提升了多角度面部表情识别的准确率。最后本文将提出的MVFGAN融合算法与现有的多角度人脸表情识别算法在几个知名的人脸表情数据集上进行了对比实验,本文提出的方法明显优于其它方法,也印证了本文算法的有效性。
其他文献
研究背景:间质性肺疾病是由200余种疾病组成的一类疾病,纤维化病理特点包括肺组织间质细胞增殖、细胞外基质增生沉积及肺实质的重构,以活动性呼吸困难、X线胸片弥漫性浸润阴影、
基层电大在我国成人高等教育中发展迅速,并承担着培养地方人才和提高人口素质的作用。而加强党建工作是当前社会发展的重要课题,党小组建设在党建工作中发挥着非常重要的地位
隐性唇裂是唇裂中最轻微的一种类型,其病理基础是口轮匝肌的断裂和移位、鼻唇肌肉张力带的破坏。隐性唇裂的修复重点是口轮匝肌连续性的恢复和唇鼻肌肉张力带的重建。传统的
非常规油气资源已成为准噶尔盆地油气勘探的新领域之一。以吉木萨尔凹陷二叠系芦草沟组为着手点,开展页岩油形成与富集的地质条件、"甜点"评价及预测技术方法等研究。通过总
在适应和减缓气候变化大背景下,党的“十七大”、“十八大”、“十九大”大力推进中国生态文明建设。中国政府提出通过发展低碳经济、构建低碳社会、采取低碳模式等方案来落
类型一测量型实验题1.直接测量型实验物理是以实验为基础的学科,掌握各类常见仪器的读数和使用,是做好物理实验的前提,因此在中考中对此处的考查一直是重点和热点.例1在实验
随着互联网技术不断发展,用户群体不断扩大,网络结构数据在日常生活中已经相当普遍,如何挖掘和利用网络结构中的潜在信息是我们的研究目标。本文主要围绕网络结构数据中存在的以下三个问题进行展开。一是传统网络表示学习方法采样方式的灵活性问题,二是网络结构数据中零次学习的问题,三是网络嵌入算法的可视化分析系统亟待补充的问题。网络表示学习技术就是充分利用网络结构数据的方法。通过网络表示学习技术可以挖掘网络结构中
目的:评价经胸超声心动图(TTE)在急性肺栓塞(APE)的诊断及预后判定中的应用价值。方法:回顾性研究CT肺血管造影(CTPA)确诊为APE患者53例(就诊时体循环收缩压>90mmHg,若合并高
【正】 关心遗体并进行安葬,是人类特有的行为.自从人类进入阶级社会后,随着物质生产的进步和社会财富的积累与分化,人们在丧葬上也就产生了等级与厚薄之分.厚葬表现了统治者
目的:观察闭合性股骨干骨折急性期软组织肿胀予以复方地榆炭膏治疗的临床疗效。方法:选取闭合性股骨干骨折急性期软组织肿胀86例,将其随机分对照组与观察组各43例。对照组用