基于密集连接及注意力机制的表情识别研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:myxing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉的一个重要研究方向就是人脸表情识别,人的面部表情是其情绪的重要外在表现,甚至可以说是最重要的外在表现,人与人之间的情感交流很多时候都是通过我们的面部表情来完成的。因此,通过研究计算机对于人脸表情的识别,可以有效的帮助机器理解人的情感,促进人机交互的发展。不过由于一部分人脸表情的界定比较模糊,加上人脸的姿态以及人面部周围的环境的影响会导致机器对于人脸表情的判断的鲁棒性大大降低。本文通过实验,对不同模型在人脸表情上的优劣性进行研究探讨,并加以改进。本文的主要工作如下:(1)针对传统卷积神经网络只注重网络模型深度而忽视轻量化造成计算机性能压力提升,或只注重轻量化而忽视了模型深度对复杂特征提取的重要性这两个方面的问题,受到密集连接卷积网络的启发,对密集连接卷积网络进行了一定的改进,使得模型能够在保持较深的网络深度的同时,模型对参数的需求量大大降低,且具有较高的预测准确率,实现了对模型参数极高的利用率。实验对比了牛津视觉几何小组网络(VGG)、密集连接网络(Dense Net)以及残差网络(Res Net)等主流流行网络,并且采用了Fer2013数据集作为人脸表情识别模型的训练以及测试数据集,实验过程中对人脸表情数据集进行了一系列的翻转、光照的调整等数据增强操作。同时在训练时针对模型当前的训练状态,连续动态的调整模型的学习率,使得网络的学习方向始终能够处于一个较好的状态。最终实验结果表明改进模型可以保证在Fer2013数据集上得到较高的准确率,同时改进模型需要的参数数量有一定程度的降低。(2)为了更好的拟合人脸表情数据集,提升网络模型的泛化性和鲁棒性,本文在卷积神经网络模型的基础上引入了注意力机制。通过对注意力机制的引入我们可以做到对一些特征图进行筛选,将对给定任务表达能力比较强的特征进行放大增强,对于那些影响并不是很大的特征会进行一定的削弱,通过这种增强及削弱的操作达到对目标特征的筛选,并最终提高网络模型的性能。通过对多个数据集实验得到的结果进行对比,分析不同数据集对人脸表情识别的准确率的影响,结果表明卷积神经网络中引入注意力机制可以有效的提高模型的预测准确率,同时我们还发现数据集中的人脸表情越清晰、人脸表情的背景的干扰越少,所能获得的预测准确率更高;并且数据集中的人脸表情图像越多,模型能够在较少的轮数内达到较理想的拟合状态。
其他文献
随着高清视频直播、远程医疗、无人驾驶等各种大带宽业务的不断产生,人们对于网络的传输速率也提出了更高的要求。现如今,单一的网络很难随时随地地满足不同用户的业务需求,因此,利用异构无线网络实现多路径并发传输成为解决该问题的重要研究方法之一。然而,在异构无线网络环境中,不同链路状况复杂多变,加上终端的移动性,多路径并发传输不可避免地会产生队头阻塞、接收端乱序等现象,严重降低传输效率。因此,本文针对多路径
学位
传统通信网络被设计为单一网络体系架构,通过垂直集成的网元提供网络所有功能,但是它无法适应5G多样化、差异化的业务场景。为了满足在相同基础设施上支持多种具有不同性能需求的业务场景,网络切片技术(Network Slicing,NS)应运而生。它通过虚拟化技术将一个物理网络分成多个虚拟的逻辑网络,每一个网络切片之间逻辑隔离,适配各种类型的服务并满足用户的不同需求。网络切片通常包括接入侧切片(包含无线接
学位
随着计算机视觉和自动化技术的快速发展,关于工业产品表面缺陷的视觉检测技术已成为了热门的研究内容之一。传统的二维图像视觉检测技术通过图像的纹理、灰度等信息来实现物体表面的缺陷检测,但是由于二维图像缺少深度信息,这种检测技术存在不可忽略的局限性。因此,对利用三维点云数据实现的物体表面缺陷检测研究具有必要性和重要的价值。通过配准标准点云和待检测点云,并比对点云之间的差异来计算缺陷,其中配准过程将利用点云
学位
边缘检测就是获取目标物体的边缘信息的方法,通过基于轨道角动量(Orbital Angular Momentum,OAM)的螺旋相位滤波器对目标物体进行径向希尔伯特变换,螺旋相位衬度成像可获取目标物体的边缘信息。鬼成像,又称为关联成像,它的奇特之处在于成像的“非定域性”,即对于两支相关联的光路,如果物体放在其中一支光路上,通过符合测量,可以在另一支相关联的光路上获得物体的像。论文针对螺旋相位衬度成像
学位
如今现代电力系统正在向智能化方向发展,大量的智能设备,如智能仪表和传感器,促进了电力系统在发电、变电、输电和配电模式方面的转变,使得智能电网成为一个典型的网络物理系统,即将物理电力传输系统和计算机网络相结合。在智能电网中,监督控制和数据采集系统(SCADA)实时收集外场设备通过网络发送来的数据,进行分析后向控制中心汇报收集到的信息,控制中心根据这些信息对电网的发电配电进行调整。在享受智能电网带来便
学位
城市垃圾焚烧发电是生物质能源再利用的重要方法之一。但是,其中可回收垃圾的焚烧会带来资源浪费和环境破坏。当前,垃圾处理工厂主要依赖人工分拣的方式从城市垃圾中筛选出可回收垃圾。这种方式工作效率低,成本代价大,不利于人员身心健康。本文针对生物质焚烧发电面临的可回收垃圾分拣难题展开研究。利用目标检测技术,为焚烧发电前的垃圾分拣赋能,以提升工作效率。本文主要工作概述如下:(1)构建了多维度可回收垃圾检测数据
学位
移动通信技术在给人们带来便利的同时,也产生了海量的数据流量,给传输链路带来了极大的压力。为了缓解这一压力,缓存技术被提出并得到了广泛的应用。基于高密度蜂窝网络与设备到设备(Device-to-Device,D2D)通信技术,通过预先将数据缓存到边缘基站或用户中,可以节省核心链路的负担,降低文件的传输时延。传统的流行度缓存策略可以提高用户自身的缓存命中率,但不一定适应所有的场景,因此为了满足不同场景
学位
随着科学技术的深入发展,无线通信网络越来越朝着智能化、多元化的方向发展,第五代移动通信技术5G(5th generation,5G)已经成为当今全球性的研究热点。当前已经进入大数据和人工智能的时代,随着各种智能终端越来越普及,数据流量也出现爆炸式的增长,使得频谱资源更加紧缺。在众多提高频谱利用率的技术中,非正交多址接入技术(Non-orthogonal Multiple Access,NOMA)具
学位
随着第五代移动通信系统(The 5th Generation Mobile Communication System,5G)的大规模部署和商用,国内外研究人员开始了未来第六代移动通信系统(The 6th Generation Mobile Communication System,6G)的预研。预计6G能提供全球覆盖、更高的传输速率、更低的时延和能耗。多输入多输出(Multiple-Input M
学位
随着第五代无线通信系统(The 5th Generation Wireless Communication System,5G)的逐步商用,第六代无线通信系统(The 6th Generation Wireless Communication System,6G)的研究与开发引起了学术界和工业界的广泛关注。6G预计将提供更广的覆盖范围、更高的频谱和能源效率、以及更好的保密性能。可重构智能反射面(R
学位