基于三维残差卷积网络的微表情识别

来源 :天津大学 | 被引量 : 0次 | 上传用户:wuzhiqing1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微表情是一种发生非常迅速的表情,持续时间一般情况下只有1/25s~1/5s,发生时动作幅度微小,人很难凭借肉眼直接察觉,其同时是一种无法抑制且无法伪造的自发式表情,更适合作为人类真实心理想法的依据,在心理研究、公共安全、商务谈判等领域具有更强的适用性。目前微表情识别方法仍多依赖于手工提取特征,费时费力且能够提取到的特征有限,导致最终识别结果不理想。随着技术发展,已有研究人员将深度学习算法引入到微表情识别领域,但其普遍只关注了空间域特征,而忽略了连续动作本身所具备的时域信息,导致识别效果还有提升空间。同时,目前现有的微表情数据集稀缺,且现有数据集也存在着帧数不统一、图像不规范等问题。本文针对这两个问题展开研究,主要的工作内容有如下方面:(1)提出一种基于感兴趣区域做几何变换的微表情数据扩充方式。通过先验经验结合微表情表达特性,以面部关键点为基础,划分出对微表情敏感的感兴趣区域。通过对比现有的几何变换方式,结合微表情特征变化微弱的特点,选择缩放、镜像以及这二者的组合变换作为扩充方法。大体流程为先对图像样本进行人脸检测,标记面部关键点,并对图像进行裁剪和归一化处理,然后基于图像序列对应的顶点帧,进行感兴趣区域的几何变换,生成新的图像样本。实验结果证明该方法能产生大量的噪声影响小的新图像数据;同时本文也通过多种哈希算法来比较生成图片与原图片的相似度,均取得了良好的结果,证明了新样本的有效性;(2)目前应用于微表情识别的大多数深度学习都是只关注了样本的空间特征,对时域特征没有进行有效提取。针对这种情况,本文提出了一种新的基于3DRes Net网络结构来完成微表情识别。其在三维卷积神经网络的基础上,结合残差网络思想,得到一种新的三维残差模块,并对应搭建了一种新的3D-Res Net网络结构。根据实验得知,结合不同的微表情数据扩充方法,分别取得了68.78%和70.38%的结果,达到了比以往更好的效果。
其他文献
随着航天技术的快速发展,空间各类传感器是研究的热点,用于惯性导航的惯性元件对各项精度提出了更高的要求。基于磁流体动力学(Magneto-hydro-dynamic,简称MHD)的微角振动传感器是空间已经验证的有效传感器,具备宽频带、抗冲击、低噪声和体积小等特性。噪声是MHD微角振动传感器的关键技术指标,其内的导电流体与流体环液-固接触电阻是噪声的主要来源,为提高传感器灵敏度降低噪声需开展液-固接触
随着社会对工程人才的质量要求不断提高,国际工程教育质量标准由“符合”逐渐转向“适用”。各国工程教育更加注重技术人才对理论知识的深入理解和灵活运用,以及技术人才的工程实践能力和创新能力的培养。工程教育模式的转型与完善是技术人才能力培养的风向标,CDIO工程教育模式是近年来国际工程教育改革的最新成果。CDIO即构思、设计、实践和运作,它以产品研发到运行的生命周期为载体,旨在为实验者提供一种强调以工程为
南海作为“21世纪海上丝绸之路”的重要海域,海浪研究对于南海海洋工程建设、海洋开发、航运作业和海洋渔业等具有重要意义。然而海洋波浪复杂,常伴随着危险,快速准确的波高预测可以提前了解海况,提供相关数据,做出正确的决策,保证海上航行、作业的顺利进行以及人员的安全。本文采用智能算法优化的BP神经网络对南海波高进行预测,主要研究内容有以下几个方面:(1)使用WAVEWATCH-Ⅲ(WW3)模型模拟了201
近年来肝癌的发病率和总体死亡率呈上升趋势,其中,原发性肝癌是肝脏中最常见的恶性肿瘤,由于肝癌的发病过程极为复杂,传统的诊断方法不能有效且准确地对原发性肝癌进行早期诊断,因此寻找一种有效的肝癌早期诊断方法成为了提高肝癌患者生存率的关键。本文设计并加工了一种新型双通道光纤表面等离子体共振(Surface Plasmon Resonance,SPR)传感器,并提出基于该传感器进行联合检测早期肝癌标志物的
基于磁流体动力学(Magnetohydrodynamic,MHD)的微角振动传感器,能够敏感微振动频率和角速率,具有高的动态特性和宽的阻尼调节特性。相较于传统的角速率传感器(如陀螺仪)不存在机械磨损和摩擦阻尼,可靠性高,寿命长,广泛应用于航空航天领域。目前MHD微角振动传感器的研究主要集中在流体环结构、磁路结构、低频拓展及信号降噪等,对内部导电流体参数及对传感器性能影响的研究鲜有报道,如导电流体气
当今世界科技越来越发达,普通二维显示已经无法满足人们更高的需求。三维沙盘显示越来越受到人们的关注。当今三维数字沙盘主要是在传统的沙盘上面添加多媒体投影系统或将计算机远程控制技术与实体沙盘模型结合,通过控制沙盘动态变化,将一些图片或者遥感信息按照真实比例缩小重新呈现在人们的眼前。但是这些沙盘大多有占地面积较大、不易移动、重复使用度不高等缺点。本课题重新设计了一套方便拆卸、占地面积小、可扩充的三维沙盘
在当下万物互联浪潮的推动下,物联网服务的近场通信技术成为了当前的研究热点问题,尤其是人们对于利用室内定位实现人员管理及重要物品的信息动态掌控的需求也在日益增加。射频定位技术已经广泛的应用于商业、医疗、工业管理等领域,该技术可以实现对象的物理位置的精确定位,如何提高该定位方式的精度尤其是应急环境下的精确定位,将对人员管理和物联网的发展有重要的意义。RFID定位技术利用射频方式进行非接触式双向通信交换
随着人工智能技术的深入发展,计算机视觉领域取得了大量的成果,尤其在计算机视觉识别领域,优秀的图像目标识别模型层出不穷,但是目标识别任务仍存在诸多的挑战。一方面计算机视觉识别模型的训练往往需要大量图像数据的支持,另一方面精确的图像实例级标注需要极为昂贵的人力成本。为了对计算机视觉的目标识别和自动驾驶的感知领域提供更好的基础支撑,本文设计了针对交通环境下的标注软件对采集的真实交通环境中的图像数据进行了
人脸属性分类任务是对给定的人脸图像提取特征,并进行特定属性的多标签分类。人脸属性是人类可理解的直观语义特征,比如眼睛、胡须、皱纹等,表情也是人脸属性的细分,比如微笑、愤怒等,由此看来人脸属性对于人脸特征的语义级别表述非常重要。现有的人脸属性识别方法包括两类,一类是针对每个属性单独训练二分类器,最后综合多个分类器完成多属性识别,这类方法可控性好,但是没有考虑到属性之间的关联;还有一类是多任务学习,特
同时定位与地图构建(Simultaneous Localization and Mapping,SLAM)是机器人自主导航定位的关键技术。以相机为传感器的视觉SLAM系统在近十余年中发展出包括非直接法、直接法和混合法在内的多种算法,这些算法在多种精确测定的数据集中可以完成基本的视觉定位和地图模型构建的任务。对于虚拟现实/增强现实等实际应用,现行算法不能很好地处理一些复杂运动的相机位姿估计,另外,一