【摘 要】
:
微表情是在人们想要隐藏真实内心情绪,无法伪装和抑制的情况下产生的自发情绪,微表情识别在国家公共安全、临床诊断、审讯等领域具有广泛的应用前景。但微表情是面部肌肉的一种局部小幅度动作,通常只持续半秒,肉眼很难直接检测或识别。因此,需要实现微表情分析与识别的自动化。相较于传统手工特征描述的微表情识别方法,使用卷积网络的深度学习方法以端到端方式集成特征自动提取和分类,在微表情识别领域取得更好的识别性能。卷
论文部分内容阅读
微表情是在人们想要隐藏真实内心情绪,无法伪装和抑制的情况下产生的自发情绪,微表情识别在国家公共安全、临床诊断、审讯等领域具有广泛的应用前景。但微表情是面部肌肉的一种局部小幅度动作,通常只持续半秒,肉眼很难直接检测或识别。因此,需要实现微表情分析与识别的自动化。相较于传统手工特征描述的微表情识别方法,使用卷积网络的深度学习方法以端到端方式集成特征自动提取和分类,在微表情识别领域取得更好的识别性能。卷积网络具有优秀的特征提取能力,但是卷积网络不考虑人脸结构信息,且需要大量训练数据。而新型胶囊网络考虑特征部分与整体的关系,以向量的方式利用了人脸图像的结构特征,适量的数据集就能训练出性能较好的网络。基于此,本文首先提出基于深度卷积注意胶囊网络的微表情识别方法(Deep Convolutional Attention Capsule Neural Network,DCACNN),解决微表情运动范围小、当前微表情识别方法忽略人脸空间结构信息的问题。但单通道深度卷积网络存在特征输入单一和过拟合的问题,因此本文提出了基于时空卷积胶囊网络的微表情识别方法(Spatio-Temporal Convolutional Capsule Network,ST-CapsNet)。ST-CapsNet改进了深度卷积注意网络,采用Res Net为基础的双流浅层网络提取微表情运动放大图像中的空间和光流图像中的时间特征。在特征提取网络中嵌入卷积注意模块,使网络在提取微表情时空特征的过程中自适应学习通道和空间特征权重,调整特征精准度。然后将通道融合后的时空特征使用胶囊网络进行微表情分类,增强特征关联性和微表情识别效果。本文还使用新的池化方式Soft Pool对ST-Caps Net进行优化,改善下采样导致的信息损失,在特征提取过程中实现对微表情细节特征的保留和关注。为了验证ST-CapsNet的先进性和有效性,本文选择留一交叉验证的方式在CASME II、SAMM和SMIC数据集上进行实验和分析,分别取得了72.21%、63.35%、67.12%的识别准确率,与先进微表情识别方法和DCACNN相比,实验结果表明ST-Caps Net有效改善了微表情识别性能,同时通过融合方式的对比试验和模块有效性实验,验证了ST-Caps Net的结构和识别性能。最后通过主观分析和定量对比验证了引入SoftPool的有效性。
其他文献
本文研究了量子信道的纠缠检测。通过将信道纠缠与对应的Choi态的纠缠相关联,实现了利用量子态纠缠检测方法类似地构造信道纠缠检测的方法。基于两体量子态纠缠检测的三种纠缠目击者算子,本文构造了三种信道纠缠目击者算子。此外,本文将这三种信道纠缠目击者算子用于检测有噪声的由CNOT(控制非门)或者SWAP(交换门)组成的两体量子线路的纠缠,并比较了它们的性能。从结果来看,这三种算子可以成为两体量子信道常规
互联网平台的迅速崛起为民众提供了发表观点的场所,评论文本中蕴含着丰富的主观情感倾向,文本情感分类研究受到广泛关注。目前,深度学习技术凭借优秀的特征捕捉能力,逐渐成为文本情感分类研究的主流方法。然而,部分基础模型特征提取能力单一,导致特征表示不够全面。同时,复杂的模型结构意味着繁琐的参数调节过程。针对深度学习方法存在的问题,本文以文本情感分类任务为切入点,构建基于混沌狮群优化的情感分析模型和多尺度语
无线传感器网络作为一种新型的监控方式,可对周围环境进行监测和数据采集,是物联网的重要组成部分,已广泛应用于各个领域。由于无人机具有易部署、灵活性高、机动性强等特点,使用无人机收集传感器监测的数据可以减少延迟,增强无线传感器网络的可持续性。然而,无线信道的广播特性增加了无线通信被窃听的风险。为使监测数据和敏感信息不被泄露,无线通信的安全问题必须得到保障。然而,现有工作在保护无线通信安全的同时均未考虑
智能规划是人工智能研究的主要领域之一,其使用自动化的过程处理现实中的规划和调度问题。随着规划问题的不断复杂化,出现了具有不确定性因素的规划问题。这类问题很难使用原有的智能规划技术求解,这时就出现了概率规划。概率规划作为智能规划的一个分支,弥补了智能规划在求解不确定性问题方面的不足,并逐渐成为研究的热点。概率规划能很好的支持动作的并行性和动作的不确定性。但这些特性会导致随着状态变量个数的增加,状态数
在共乘场景中,具有相似出行路线和相近出行时间的多名乘客一同出行,能降低出行的成本和缓解交通拥堵。同时,减少实际所需的车辆数目能减少用于交通运输的能源消耗。然而现有的共乘研究大多忽略了提供接载服务的车辆的收费标准不一致对乘客出行服务质量的影响。本文针对共乘平台能实时接收共乘出行请求的场景,研究司机与乘客之间的匹配问题。由于司机与乘客双方都存在策略的选择,本文将双方的匹配过程构建为一个主从博弈的过程。
针对一类电磁感应现象的独特过程(自感现象的暂态过程)给出了教学实施案例和简要评析,以期给同行参考。
单张图像超分辨率(Single Image Super-Resolution,SISR)是根据低分辨率图像重建高分辨率图像的操作,是计算机视觉方向里一个重要分支。它也是医学图像、监控和安全等实际领域被广泛使用的图像处理手段。图像超分辨率既可以增加图像的视觉效果,也可以在其他计算机视觉问题中,提高程序的性能。在最近几年,由于深度学习的进步,由深度神经网络构建的图像超分辨率模型得到了积极探索。这些图像
近年来,许多新兴的应用基于深度神经网络为移动终端提供视频分析服务,例如增强现实、人脸识别、智能摄像等等。然而,这类应用通常需要大量的计算资源以提供支撑,远超终端设备的处理能力。将视频分析任务卸载到云端/边缘服务器是近年来解决该瓶颈的一个研究方向。上述研究方向有如下两种研究视角:从终端的视角出发,需要研究视频帧的传输配置,例如分辨率、码率和采样率等等,以最大化该终端能够获得的视频分析精度;从视频分析
近年间得益于强大的硬件计算性能和深度学习的蓬勃发展,以BERT为代表的自然语言模型陆续登上舞台,其在GLUE、SQu AD和RACE等自然语言处理测试任务集上取得了SOTA的优异成绩。与此同时,在通用领域上取得优异成绩的BERT模型却因受限于预训练过程中的语料规模,训练过程中缺少专业领域的事实知识,导致其准确度性能在专业领域中受到限制。目前已有学者提出知识增强型BERT模型,通过引入外部专业知识改