基于深度生成对抗学习技术的人脸情感识别研究及应用

来源 :南昌大学 | 被引量 : 0次 | 上传用户:tjmaomaoxiong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类的面部表情是反映人类情绪的最常见方式之一,而理解不同类别的面部表情是分析人类感知和情感状态的重要方法。在过去的几十年中,面部表情分析(Facial Expression Analysis,FEA)得到了广泛的研究。经典的关于面部表情的理论把世界各个地区以及种族的面部表情大致分为6类或7类。然而在现实生活中,面部表情的识别会受到各种条件的干扰,例如姿态、光照、遮挡、环境以及人类自身情绪的复杂性等因素,这给面部表情分析带来了很大的挑战,因此采用计算机来进行人脸表情识别,从而获取人类情绪也成为了计算机视觉领域中的热点方向之一。随着硬件的不断更新迭代,深度学习技术也随之得到了长足的发展,深度学习技术逐渐被广泛地应用于各个领域并取得了突破性的进展,特别在计算机视觉领域当中。人脸表情识别作为计算机视觉领域的核心技术,已经有较为丰富的研究成果,但是仍存在某些不足之处,如存在相关算法模型识别准确率较低、模型框架较为冗余、查全率较差等问题。为解决上述问题,本文在多标签、单标签、基于视频的人脸表情识别技术中分别引入深度学习的方法,构建了新的框架、改进了算法并提高了识别的准确率,增强了人脸表情识别技术的鲁棒性。同时本文也对人脸表情识别技术在社会管理中的一些应用进行探讨,提出了一些建议和对策。本文主要研究内容如下:(1)提出新型的多标签面部表情识别及多特征联合集成学习框架(MF-JLE)。它在考虑了许多面部动作单元中的多个表情标签因素的基础上,将全局特征与几种不同的局部关键特征进行平衡。该框架相比其他框架采用了集成学习的方式并引入了二元交叉熵损失函数,获得了更好的集成学习效果。(2)提出了基于生成对抗网络的面部表情识别多模型联合集成学习框架。该框架由Star Gan进行数据增强,再由一个卷积神经网络和一个Swin-transformer模块进行集成学习。在该框架下,基于生成对抗网络的数据增强的方法可以缓解Transformer类模型在小数据集效果不佳的缺陷,而采用Swin-transformer可有效提高感受视野的问题,同时集成带有通道注意力和空间注意力机制的卷积神经网络可以加强模型整体的识别精度。总的来说该框架结合了传统卷积神经网络的优势,以及Transformer的高性能,从而提高了网络的学习效果。(3)提出了基于生成对抗网络与视频图像序列的面部表情识别框架。该方法采用Transformer来分别提取视频中不同帧的时序信息,同时用生成对抗网络对峰值帧的人脸表情图片进行生成,以缓解峰值帧的人脸表情图片数据不足的缺陷。同时再利用Transformer网络对峰值帧图片以及提取的图像序列图片进行特征提取,其中将提取的视频序列图片的特征输入Net VLAD模块使视频序列特征转化为多个视频帧的图片特征,最后利用所提取的时序信息以及图片的表情特征来进行分类。总的来说该工作希望仅用Transformer类型网络,解决提取时序信息和图像特征两方面任务的同时获得较好的分类效果。综上,本文提出了三个算法框架,分别在多标签人脸表情识别、单标签人脸表情识别以及基于视频的人脸表情识别三个领域证明了相应算法框架的有效性,并深入探讨了算法的优化过程。最后在一些标准数据集中进行验证,本文所提出的算法框架都取得了优异的成绩。此外,本文还对人脸表情识别技术在教育管理、医疗管理、交通管理以及国家安全管理等领域上的应用进行了探讨和分析。
其他文献
作为一种应用前景广阔的太阳能光伏器件,有机太阳能电池具有重量轻、价格低、可室温溶液加工和可制备柔性器件等优势。近年来有机太阳能电池的能量转换效率(PCE)取得了突破性进展,单结有机太阳能电池的器件效率已经超过19%。为进一步提高有机太阳能电池的能量转换效率,设计合成新型给受体材料是至关重要的一方面。而目前给受体材料的分子设计普遍存在着新型结构单元开发受限和开发成本较高的问题。针对这些问题,本文采用
学位
近年来,中空金属-有机框架(HMOFs)材料因同时兼具中空结构和MOFs固有的特性得到了广泛的研究和应用。尤其是在催化应用领域,中空MOFs作为优异的载体基质不但具备丰富的活性位点和大的比表面积,而且其中空结构为加速质量传递提供先决条件。本论文分别从中空MOFs的空腔内部功能化设计、中空MOFs的壳层功能化设计和中空MOFs的构建入手,致力于解决以下三个问题,(Ⅰ)大尺寸分子均相催化剂难以被MOF
学位
烃基化反应是有机合成及化工生产中非常重要一类反应,是构筑C—X(X=C、N、O、S等)键的重要的手段。与传统的烃基化反应相比,过渡金属催化的交叉脱氢偶联(CDC)烃基化反应具有高效、原子经济性和环境友好等优点,更符合绿色合成理念。本文的主要工作是探索在廉价的过渡金属催化下,在芳香环的C(sp~2)原子以及芳香胺中N原子上分别引入烃基的新方法,并利用所发展的方法制备一系列在精细化工合成中重要的C、N
学位
伴随着风力发电机单机装机容量的持续增加,风机塔架的高度也从最初的30米左右达到现在的100~200米。随着塔架高度的增加,对风机塔架的结构强度、刚度、稳定性等提出了更高的要求。因此,本文提出了新型的三角形断面风机塔架结构,并对它的结构形式开展了深入的研究。另外,偏航制动器是控制风力发电机转动的结构,它是风力发电系统的重要组成部分。本文对风机偏航制动器结构中的若干力学问题开展了深入的研究。然而三角形
学位
法律实践拥有价值要点,法律实践的价值要点一方面使得法律实践是拥有吸引力的因此人们拥有遵守法律的义务,另一方面也主宰着对法律的解释。法律主张的真值与价值问题紧密相关。德沃金通过对外在道德怀疑论的批评论证道德主张乃至价值主张是能够为真的。德沃金对价值主张如何为真的回答则是:价值主张基于其他价值主张的支持而为真,这就是价值一体性的核心。价值一体性是价值的认识论,也就是关于价值领域什么是可靠的知识的理论。
学位
随着我国经济和智慧城市技术的不断发展,公共场所的视频监控网络规模不断扩大。公共场所复杂环境下的目标检测和异常行为检测在计算机视觉领域引起了大量学者的广泛关注,如图像的显著性检测、群体异常行为检测和图像中关键人物的检测等技术。集会场景下的关注性对象检测旨在公共场所复杂环境下,自动检测出视频或图像中群体关注的对象。在集会场景下,群体关注的对象往往和视频监控者关注的对象一致。而且在公共场合群体关注对象的
学位
有机太阳电池由于其质量轻、成本低和可用于制备柔性器件、半透明等独特的优势,在印刷和卷对卷工艺中具有巨大潜力。随后,半透明有机太阳电池由于其可结合储能和可视功能的特点,于近年来受到科研工作者的广泛关注。与传统的有机太阳电池相比较,半透明有机太阳电池由于其在可见光区域透光率较好,表现出广阔的应用前景。准平面异质结活性层结构由于其给受体层可独立制备的特点,较本体异质结结构更适合工业化大面积印刷制备。但是
学位
随着我国经济的高速发展,VOCs排放导致的大气污染问题日益严重。通过催化燃烧技术,将VOCs氧化为CO2和H2O是最为经济和高效的方法之一。研制高效、廉价的催化剂是提升催化燃烧技术成效的关键。本论文从成本控制角度出发,采用价格更低廉的贵金属Ru作为催化剂活性组分,用于甲苯燃烧反应。(1)A2B2O7复合氧化物具有高热稳定性和优异的氧迁移能力,符合VOCs燃烧反应对于催化剂结构和活性位点的要求。因此
学位
网络技术的发展与普及在深刻改变信息传播方式的同时,导致了网络环境下著作权犯罪呈现出扩张的趋势,使得传统的刑事治理理论面临着严峻的挑战。2019年11月中共中央办公厅、国务院办公厅印发了《关于强化知识产权保护的意见》,指出“加强刑事司法保护,推进刑事法律和司法解释的修订完善。加大刑事打击力度,研究降低侵犯知识产权犯罪入罪标准,提高量刑处罚力度,修改罪状表述,推动解决涉案侵权物品处置等问题。”著作权是
学位
本文首先从当代物流发展的实际状况出发,深刻分析了交通物流运输当中存在的各种不合理化因素,从而提出运用偏微分方程建模的方法去解决实际交通运输管理问题的新思路。其次,因为交通运输是物流中最重要的功能要素之一,于是本文利用偏微分方程建立数学模型去解决交通管理与决策中的问题,并提出要把更加复杂、更多种类的椭圆型偏微分方程应用于解决交通管理的实际问题。第三,本文重点研究了几种不同类型的非局部椭圆方程解的相关
学位