基于深度学习的多姿态人脸表情识别方法研究

来源 :上海工程技术大学 | 被引量 : 0次 | 上传用户:neithernor86
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
表情识别技术作为面部识别技术的研究分支,在人机智能交互、智慧诊断、智能控制和数字教育等领域具有广阔的应用场景。表情识别研究涉及到统计学、心理学、计算机科学等多学科领域,具有一定的复杂性和可研究性。人脸表情识别的主流研究方法主要是传统机器学习方法以及基于深度学习网络的端到端方法。基于机器学习的人脸表情识别算法通常由图像预处理、特征提取、特征分类三个子任务构成,特征提取与表情分类器需要根据任务情况人工选择。深度学习可以实现端到端的表情识别,实现表情特征的自动提取和网络的自主学习。深度网络在人脸表情识别问题上有着广泛的应用,集成网络、级联网络、残差网络等网络结构的提出使得表情识别性能得到提升。目前,表情识别任务在实验室数据集下能够取得较好的识别效果,而面对具有挑战的自然场景下的表情识别任务仍存在一定的不足。自然场景下的面部多姿态问题是影响表情识别性能的主要因素之一。此外,背景干扰和表情类别相似等因素也会导致表情识别准确率降低。针对上述人脸表情识别问题,本文利用深度学习技术对多姿态表情识别问题展开了进一步的研究,主要的研究内容如下:(1)针对面部姿态在翻滚角(roll)上的姿态变化以及高相似表情误判问题,给出了一种结合关键点与权重分配残差网络的人脸表情识别算法。本文首先通过全局人脸对齐来调整面部姿态在翻滚角上的变化;然后使用面部关键点技术进行最大表情表达其区域的获取去除背景因素的干扰;接下来引入权重分配机制从通道和空间维度上进行注意权重推断,实现不同区域的权重分配,进而引导深度残差网络学习对表情具有鉴别力的局部特征,有效提升了高相似表情类别的识别准确率。实验结果表明,本文方法在FER2013和CK+数据集上的表情识别准确率分别达到74.14%和98.99%,说明本文方法可以有效矫正翻滚角姿态和去除背景干扰,进而改善伤心、害怕、蔑视等高相似表情误判问题。(2)对于面部姿态在俯仰角(pitch)与偏航角(yaw)上的变化,往往会形成不同角度的侧脸。该姿态变化不能通过人脸对齐进行有效地矫正,常见的解决办法是使用多视角人脸表情图像进行不同姿态下的表情特征提取,而多视角表情数据的缺乏对该方法造成很大障碍。本文提出基于图像生成与联合损失优化的表情识别方法。首先通过三维人脸模型的颜色纹理映射,结合旋转渲染实现单一图像的多姿态图像生成;然后,将生成的多姿态表情图像输入到深度网络中进行多姿态表情特征的提取;接着使用softmax损失函数和中心损失函数构建联合损失函数,用来优化特征空间中表情类别之间的距离(缩小表情特征类内距离,增大类间距离),改善相似度高的表情类别识别准确率。使用本文方法对数据集FERplus、RAF-DB的训练集进行多视角图像生成用于模型训练,分别取得87.36%、87.20%的识别准确率。实验结果表明,本文方法的准确率与baseline相比平均提升3.4%,比近年提出的一些方法平均提升了1.06%,说明本文方法能够有效应对人脸表情在俯仰角与偏航角上的姿态变化。
其他文献
近年来,深度相机、三维激光扫描仪、激光雷达等三维数据采集设备在机器人感知、无人驾驶、虚拟现实等三维感知领域有非常广泛的应用。此外,越来越多计算机视觉领域的学者把目光转到了以三维点云为研究对象的三维感知领域中。而三维点云的分类与分割是三维感知领域的相关技术中最为基础且最为关键的任务,为三维场景理解与智能分析奠定了基础。因此,提高三维点云分类与分割技术的整体性能具有重要的实际应用意义。由于三维点云的数
学位
中国与俄罗斯金贸往来密切,两国的贸易额逐年攀升,随着两国经济的发展,两国之间的贸易还会进一步的增加,越来越多的中国企业走进了俄罗斯进行投资和办厂,越来越多的俄罗斯产品出口到中国。但是两国人民的消费行为会对这些走出国门的企业发展有相当大的影响,从而对中俄两国经济贸易产生较大影响。因此,研究中俄两国消费者的购买欲望、动机和消费行为偏好,对消费者消费行为的影响具有重要意义。本研究以消费者行为理论为基础,
学位
随着工业现代化的加速发展,智慧工厂概念在多个行业中得到了极大的关注,其中,AGV的技术发展与应用是实现智慧工厂智能化的关键。通过计算机视觉技术对AGV系统进行控制,具有投入小、自由度高等优势,因此,基于视觉实现AGV的自主导航逐渐成为研究热点。目前,基于视觉导航的AGV系统存在环境复杂、障碍物检测困难、计算量大等问题,针对这些问题,本文围绕局部视觉与全局视觉进行研究。在局部视觉中,需要解决由光照不
学位
近几年全球糖尿病统计结果显示,我国目前是世界上患糖尿病人数最多的国家。该病会带来很多并发症,糖尿病肾病是其中最为严重的一种,尿细胞的定期检验能够有效防治该疾病。面对医院庞大的检验量,为了减少人工操作量,提高效率和检验正确率,建立医学检验管理系统是当前的必然趋势,国内不少大型医院已经建立了基于各学科的一体化管理系统。因此,尿细胞检验管理系统的研究具有重要意义。目前尿细胞检验主要采用染色分析法,国内外
学位
随着数字媒体技术的不断发展,出现了大量的图像编辑软件供人们轻易地修改图像。人们在享受数字生活更加便利的同时,也在法律盲区利用工具的便捷性不断制造篡改的数字图像,这已对军事、经济、媒体、文化、司法等诸多领域产生了严重的不良影响,同时也对图像取证领域的学者们提出了更高的要求。目前基于深度学习的图像内容被动取证算法主要切入点是取证界人为定义的篡改类型,如复制-粘贴、拼接、移除等。另外大多数算法在检测篡改
学位
在课堂中,学生的情感状态与认知活动具有密切的联系。情感状态能够反映学习状态,也能够反映课堂的学习氛围。因此,对课堂上学生的情感状态进行精确的识别具有重要的意义。传统课堂上学生的情感状态识别主要通过教师肉眼观察,这会影响教师上课的注意力,当学生较多时,教师没有精力去观察每个学生的情感状态变化。在网络在线教学中,教师与学生的互动方式受限,而且学生的人数可能更多,教师无法实时观察学生的状态,造成教学效果
学位
光电跟瞄技术在军事、航空航天行业发展迅速,快速位置跟踪与瞄准控制动态目标为实现目标精准跟踪提供有效的技术手段和研究发展方向。如何保持激光实现稳定跟瞄使得出射光束具有防抖动、测量误差小,同时具备精准测距功能成为本论文研究的难点。针对这些问题,本论文设计激光指向稳定控制光路,解决出射光束的位置误差问题;对位置敏感探测器(PSD)的非线性畸变进行校正,降低测量误差;研究模糊自适应PID控制器使其对跟踪目
学位
肝纤维化是因肝脏损伤而机体异常调度修复所导致的一种慢性肝病,属于一种可逆的病变,但当肝纤维化未能得到有效的治疗或控制时,肝纤维化很可能进一步发展为不可逆的肝硬化阶段,从而对患者造成更加严重的威胁。在众多诊断技术中,超声诊断技术以其价格低廉、无害、实时、便捷、设备方便移动等优势,在肝纤维化、肝硬化的大规模筛查与随访中具有明显的优势。因此本文从图像频域角度分析并解决了肝硬化及肝纤维化的病情分类问题,同
学位
秋、冬日自然界中多会出现雾霾、沙尘等视觉障碍现象,不仅影响人眼对物体的主观判断,而且会降低图像中目标物体的能见程度,影响智能交通、安防监控装置、卫星遥感监测等系统的最终处理结果。由此,图像去雾的研究在计算机视觉应用领域中起到至关重要的作用。大雾天气下的低质模糊图像恢复到高质清晰图像后,会被应用到计算机高级视觉任务(如车道线检测、目标追踪、自动驾驶等)中,这对改善人类现实生活的意义尤为突出。当前,单
学位
微电网作为一种小型电力系统,可以就地消纳由其内部新能源所产生的电能,有效降低新能源并网给主网造成的压力。微电网的主要形式分为交流微网与直流微网。随着技术不断发展,诸如电动汽车、5G通讯基站等各种直流负荷大量增多,同时直流电也是许多新能源发电技术产生电能的主要形式。直流微电网以直流电作为核心电能形式,可以有效避免反复进行交直流变换,因此拥有非常大的优势。在新能源的发电与消解问题都亟待解决的情况下,直
学位