轻量级神经网络表情识别系统的研究与实现

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:HUYA123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术与人工智能的快速发展,人脸表情识别技术成为了当前的研究热点,在人机交互、安全驾驶等多个领域有着广泛的应用前景。传统的表情识别技术不仅设计困难,而且不能充分提取表情特征,导致表情识别效果不佳。目前基于深度学习的表情识别技术成为主流方法,但现在的卷积神经网络模型对硬件要求高、训练耗时过长,导致表情识别的实时性难以得到保障,无法部署到低算力的设备上。为了进一步提高表情识别算法的准确率和鲁棒性、降低卷积神经网络的参数量和计算量,对卷积神经网络轻量化方法和表情识别方法进行了研究,并在研究的基础上实现了一套人脸表情识别系统。论文主要工作如下:(1)针对原始Ghost Net模型中Ghost瓶颈层在模型训练时,部分神经元不起作用导致信息丢失的问题,使用Mish激活函数重新设计了改进的Ghost瓶颈层;针对原始Ghost Net模型中使用的SE注意力机制并未考虑到空间层面的信息,使用更加高效轻量的归一化注意力机制作为替代;针对原始Ghost Net输入尺度过大的问题,修改了Ghost Net模型初始输入大小和层数,减少参数量和计算量,使其更适合表情识别任务。基于以上三点,提出了改进的Ghost Net模型,在FERplus和CK+数据集上进行实验,分别取得了79.339%和96.411%的准确率,验证了基于改进Ghost Net模型方法相比于其他主流轻量级卷积神经网络,在模型参数量和计算量更少的前提下,依旧有着更高的识别准确率和更快的识别速度。(2)针对人脸表情的类间差异小、类内差异大特性和Softmax交叉熵损失函数不能压缩类内空间,优化不灵活等问题,结合Island损失函数和Circle损失函数设计思想,设计并采用了基于余弦相似性的损失函数来监督神经网络的训练学习。该方法可以在特征空间中增大类间差异,减小类内差异,从而提升特征判别能力。在FERplus和CK+数据集上实验验证,基于余弦相似性的损失函数准确率高达82.561%和98.553%,效果优于Softmax交叉熵损失函数、Island损失函数和基于余弦距离的损失函数等,更适合移动端和嵌入式设备的使用场景。(3)将训练好的轻量级卷积神经网络进行实际应用,使用Py Qt5工具包来完成整个人脸表情识别系统的设计。该系统具备以下功能:通过图像识别进行静态表情识别、通过摄像头识别进行动态表情识别、可以显示识别所需时间和识别结果、可以实时显示表情预测概率分布。通过系统测试表明该系统有着很好的实时性,并且在正向脸上有着高达90%的准确率。
其他文献
随着微波技术的发展,微波集成电路在移动通信、毫米波雷达、导航等领域得到广泛的应用。集成电路设计与制造工艺的快速进步,单片微波集成电路尺寸越来越小,电路规模日益增大,功能复杂度也大幅提高,给芯片电磁兼容测试和芯片失效分析带来新的挑战。传统微波近场成像技术由于空间分辨率低、工作频段受限等因素限制已经无法满足芯片测试需求。金刚石氮-空位色心(Nitrogen-Vacancy Center,NV Cent
学位
近年来,量子精密测量作为量子力学的应用之一在测量空间分辨率、灵敏度等方面逐渐超越了传统的测试技术。芯片的集成度和复杂度提高,传统测试技术遇到瓶颈,高分辨电磁场量子精密测量在芯片设计、芯片电磁兼容测试和芯片失效分析上的价值越来越受到重视,基于金刚石NV(Nitrogen-Vacancy)色心的量子精密测量体系因其用户鲁棒性和实用性,受到广泛关注。金刚石NV色心是金刚石中的一种发光缺陷,其具有较长的电
学位
人类的情感是十分丰富的,利用文本数据进行情感分析的研究已经无法满足智能化时代情感分析的需求了,需要引入更多的模态来补充情感信息。因此多模态的情感分析中对每种模态的情感信息的获取成为了一个重要研究。同时,多模态的引入会导致情感分析的效率和资源消耗得到增加,故对情感分析的耗时和内存占用量进行优化也是一个重要的研究方向。本文针对情感分析的效率优化以及多模态情感分析不同模态的信息完整获取展开研究,主要研究
学位
传统的压电式能量收集技术,存在收集方向单一,谐振频率高,转换效率低,输出电压和功率过低的问题。因此本文针对以上问题,提出了一种直角螺旋压电能量收集器和一种圆弧螺旋压电能量收集器。并对这两种螺旋式压电能量收集器进行了数值计算、模型仿真和测试分析。与传统的能量收集器相比,其转换效率,输出电压和功率均可以得到明显改善。本文主要的研究内容如下:(1)介绍了压电能量收集器是把压电能量收集理论作为基础的,运用
学位
量子行走是经典随机行走在量子世界的对应物。基于相干叠加性和量子干涉,量子行走用于实现通用量子计算机、量子通信以及量子模拟。本论文主要讨论离散时间量子行走的基本性质,通过引入量子控制操作实现不同性质行走的相干叠加。通过光学环路结构实现能够精确调控高维量子态的可编程量子行走。主要工作概括如下。量子行走与经典随机行走之间的转变这一研究内容有助于理解量子行走的计算特性,以及与这两种行走相关的动力学。已有的
学位
图像识别技术作为人工智能领域的重要分支,在工农业和公共安全等多个领域被广泛应用。为保证安全生产,降低因作业人员未佩戴安全帽而产生的事故发生率,将图像识别技术应用到安全帽佩戴的实时检查并提高识别准确率,具有显著的工程价值。本文使用卷积神经网络对工作人员是否佩戴安全帽进行检测,主要工作如下:(1)针对在安全帽佩戴检测过程中存在目标较小,检测困难的问题,本文提出了一种基于ASPP(空洞空间金字塔池化)与
学位
移动互联网技术与时空定位技术的快速发展推动了基于位置服务应用的普及。用户基于身份信息与位置信息生成位置证明,并以其为凭证获取位置服务,是当前保证位置服务可靠性的主要方法。传统的位置证明系统采用基于基础设施的位置证明方法,并将位置证明信息在中心化数据库中存储。但是这种方法存在位置证明效率受限于基础设施附近用户分布,以及中心化数据库模式的单点故障问题。本文提出了基于基础设施与附近用户混合的位置证明方法
学位
阵列天线在移动通信、雷达、卫星通信等领域中有着广泛的应用,其中波束赋形是阵列天线的关键技术之一,研究波束赋形技术具有十分重要的意义。近年来,通过智能优化算法针对阵列天线所需的方向图快速实现波束赋形,已经成为研究的热点和重点。本文利用改进粒子群算法实现阵列天线的波束赋形。针对粒子群算法后期搜索能力弱这一问题,本文引入自适应惯性权重以及将粒子群算法与蝴蝶算法相结合这两种思路分别组成了两种不同的改进粒子
学位
Pull Request是GitHub中代码贡献的一种重要方法,当开发人员希望将其代码更改从本地机器合并到存储项目中所有源代码的主存储库时,将提交Pull Request。在将代码更改合并到主存储库之前,开发人员必须请求权限。如果它们的源代码被允许合并,则Pull Request状态显示为被接受。另一方面,如果不允许合并它们的源代码,则Pull Request状态将显示为被拒绝。由于多个因素,例如
学位
频繁子图挖掘是频繁模式挖掘的一种具体形式,广泛应用于社会网络分析、生物技术、推荐系统等领域。然而,图数据集中可能包含一些敏感的信息,在挖掘过程中或发布频繁子图信息时都可能造成隐私的泄露。差分隐私不依赖于第三方所掌握的背景知识,具有严格的理论定义和可量化的隐私保护手段,通过调整隐私预算的大小来控制隐私保护的级别,可以应用于数据挖掘领域。差分隐私技术可以保证查询结果不会因为数据集中任一记录的改变而受到
学位