基于卷积神经网络的人脸表情识别方法的研究与实现

来源 :天津大学 | 被引量 : 0次 | 上传用户:Willy_Liang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术和计算机视觉的迅速发展,人脸表情识别算法在人机交互环节中充当着重要角色,有着非常广阔的应用前景。人脸表情识别算法可以统计学生在课堂上的听课状态、记录司机在驾驶过程中的疲劳程度、捕获危险分子在公共场所的异常表情避免不必要的事故等等。提高人脸表情识别算法的准确率是人脸表情识别领域的重要任务。
  选择合适的网络结构和损失函数对于提高基于卷积神经网络的人脸表情识别算法的准确率至关重要。人脸表情存在类内特征差异性大、类间特征相似度高的问题;传统的卷积结构有大量的参数,计算量较大。针对这些问题,本文在传统损失函数的基础上提出了一种基于余弦距离的损失函数,可以实现减小特征空间中类内特征差异、增大类间特征分布,提升了特征判别效果。同时,本文基于深度可分离卷积设计了一种网络结构,在很大程度上缩减了参数量,精简了网络模型。
  本文设计的基于卷积神经网络的人脸表情识别算法,采用的是深度可分离卷积神经网络结构,使用超参数λ取0.01、λ1取10的余弦距离损失函数进行监督训练。经过大量的实验和分析,该算法在RAF-DB人脸表情识别数据集上取得了83.196%的人脸表情识别准确率,效果优于传统损失函数监督训练的人脸表情识别算法,验证了本文所提出的算法在人脸表情识别任务中的优越性。
  在论文最后介绍了本文提出的算法应用于人脸表情识别系统的搭建过程以及实现效果,该系统可以实时识别网络摄像机视频流中人脸的表情,对于存在一定偏转角度和遮挡的人脸,也具有较高的识别精度,验证了本文提出的算法的可行性。
其他文献
该文采用蒙特卡罗方法(MCS)对气体电子崩的发展进行模拟.该文分析讨论了随机变量和随机数对蒙特卡罗模模型的收敛性、精度和误差的影响;改进了计算单一气体电子崩放电的蒙特卡罗模拟方法;提出了计算混合气体电子崩发展的蒙特卡罗模型;并对蒙特卡罗方法计算电子崩发展的特点以及应用前景进行了探讨.蒙特卡罗方法直接模拟大量电子在电场中的电子崩发展过程,其计算结果的准确性直接取决于截面的选取和校正.采用校正后的碰撞
学位
压缩感知(Compressive Sensing,CS)理论作为一种新的数据获取框架,其优势是从低维的观测值中重建高维的稀疏(或可压缩)数据,降低采样成本。观测矩阵与观测值的生成、数据重建精度密切相关,是CS理论的一个重要研究方面。经典随机矩阵的高计算复杂度和其随机结构与一些实际应用领域的不一致性,使得结构化观测矩阵的研究日益受到关注。尽管结构化观测矩阵的研究取得了一些成果,但在一些实际领域出现的
视频中的异常行为分析在交通监控、社会安防等领域有着广泛的应用,近年来已经成为计算机视觉研究的热点之一。本文针对视频中运动目标的轨迹信息提取和异常行为分析开展研究。运动物体的轨迹能够提供目标运动行为模式的宏观信息,而且与视频数据相比,轨迹信息易于储存、传输和分析,尤其适于交通场景下的长时间车辆监控。因此,本文以运动目标的轨迹作为行为的主要表征,研究异常行为分析的几个关键技术问题。一方面,研究用于视频
学位
合成孔径雷达(Synthetic Aperture Radar,SAR)遥感与光学遥感相比,能够全天时、全天候、全地域进行实时数据采集,成像效果不受时间、气候和地域的影响。同时,合成孔径雷达成像分辨率与目标距离无关,在国防和民生方面具有非常重要的作用。由于其相干成像机制,合成孔径雷达图像中不可避免地会产生斑点噪声。斑点噪声是一种依赖于观测信号的颗粒状噪声,是相干成像系统中固有的噪声,相干斑的存在降
随着对海洋资源环境越来越多地开发利用,人们对海洋信息的采集要求不断提高,测量船作为信息采集设备的主要载体,对其航行控制,尤其是航迹控制,也提出了更高的要求。自动舵是实现航迹保持的主要设备,在测量船航行过程中,由于受到海上环境的干扰,会偏离预先设定的航线,此时需要自动舵装置控制船舶改变航向,使船回到规定的航线上,这样测得的数据才是我们预期中想要得到的数据。  近年来,人工智能技术发展迅速,应用也越发
低频微振动在我们日常生活中、工业领域中随处可见,如生命体征监测、桥梁楼宇质检、地震监测等。但是,对低频微震动的测量参数获取比较复杂和困难,其被测对象形貌复杂,振动频率通常在几个赫兹范围,振动幅度在毫米,甚至亚毫米级别。因此,传统的接触式测量方法具有一定的局限性。为了实现快速、精确的全场振动测量,非接触式光学图像测量方法提供了一种合适的解决方案。非接触式光学图像测量方法是通过振动信号对图像特征点的像
学位
雾霾天气下拍摄的图像存在细节模糊、色彩偏移、低对比度等问题,严重影响户外视觉系统发挥效用。因此,雾霾图像清晰化研究具有重要的理论意义和应用价值。论文根据雾天图像成像特点,针对目前基于统计先验和基于学习方法去雾后图像易出现颜色失真、细节模糊及噪声放大等问题,提出了新的见解和方法。论文主要工作如下:  首先,为了避免图像去雾后细节模糊和噪声放大,将图像分解为结构层和纹理层,并只对其结构层进行去雾。基于
学位
随着计算机的普及和数字图像处理技术的进步,计算机视觉技术得到了飞速的发展,利用深度学习的方法进行目标检测与识别,较传统的目标检测与识别方法,实现了自动化、智能化和高效化,且具有更高的检测识别精度。  红外图像与可见光图像相比较而言,其抗干扰能力更强,红外图像的目标检测变得越来越重要,尤其是在军事领域和恶劣环境下。然而现如今,目标检测技术主要集中在可见光图像领域,可见光图像与红外图像成像原理不同,因
学位
目标检测是计算机视觉中最具挑战性的问题之一,其目的是检测图像中特定目标的位置,已广泛用于人脸识别、自动驾驶、行人检测、视频监控等领域。基于深度学习的方法由于其无需进行人工特征设计、具有良好的特征表达能力及优良的检测精度,成为当前目标检测算法的主流。针对特征金字塔网络易丢失细节和检测速度慢等问题,本文提出了高效轻量化特征金字塔网络及其目标检测算法。主要工作如下:  与基于图像金字塔的目标检测方法相比
学位
语音是人类传递信息最直接的方式。近年来,发声器官器质性或神经性的病变使得嗓音疾病发病率越来越高,嗓音含混不清会影响人们的沟通效率,采用非侵入式的信号处理方式对病理嗓音进行修复,能提高受损语音的可懂度,提高人们的沟通效率。此外,病理嗓音修复在语音识别、机器导航、语音增强、语音通信系统、军事刑侦和隐蔽监听等领域都有着很广泛的应用前景。本文以提高病理嗓音可懂度为目标,设计实现了一套完整的病理嗓音修复系统