【摘 要】
:
随着对自动情感识别系统的需求日益增长,情感识别的深入研究越来越重要。近年来,硬件和深度学习方法高速发展,自动情感识别性能不断提高。由于情感的抽象概念和多重表达,自动情感识别仍然是一项极具挑战性的任务。目前,情感识别的传统方法一是主要集中在提取不同类型的手工特征上。然后依靠人工手动标注视频的情感内容来达到情感识别的目的,但手工制作的特征总是需要特定任务的领域知识,而设计合适的特性可能更耗时。因此,探
论文部分内容阅读
随着对自动情感识别系统的需求日益增长,情感识别的深入研究越来越重要。近年来,硬件和深度学习方法高速发展,自动情感识别性能不断提高。由于情感的抽象概念和多重表达,自动情感识别仍然是一项极具挑战性的任务。目前,情感识别的传统方法一是主要集中在提取不同类型的手工特征上。然后依靠人工手动标注视频的情感内容来达到情感识别的目的,但手工制作的特征总是需要特定任务的领域知识,而设计合适的特性可能更耗时。因此,探索最有效的基于自主提取特征并学习分类的方法用于情感识别成为大多数作品的核心问题;二是大多采用单模态情感识别,实际上情感表达是由多种情感模态共同完成,例如面部表情,语音,姿态等,但人类表达情感最直接的方式主要为语音和表情,单一模态的表达虽也能识别情感,却具有一定的局限性,易受周围环境的影响,鲁棒性低,利用多模态情感信息的互补来提高识别效果也成为当下研究热点。因此,为了解决传统情感识别方法中特征提取耗时长、鲁棒性差、识别率低等问题,本文提出了一种基于深度学习的多模态情感识别方法,主要研究内容如下:(1)各模态情感数据库的数据预处理:对于语音信号,通过一系列预处理操作将一维静态梅尔频谱图转化为三维梅尔频谱图;对于表情信号,通过运用多目标定位检测识别算法提取识别区域,进行剪裁去除冗余信息。(2)语音情感特征提取:首先研究了一种基于Alex Net改进的卷积神经网络的识别方法;由于语音信号是一种时序信号,为了捕捉音频中前后的语序关系,运用长短期记忆神经网络来提取时序特征;由于LSTM无法满足长时序的准确性,提出了前馈序列记忆神经网络来充分显示时序特征。为了将各网络的优点进行集成来达到强化情感识别的效果,提出一种基于残差卷积、长短期记忆网络和前馈序列记忆神经网络相结合的语音情感识别方法。(3)视频表情情感特征提取:本文研究了一种基于三维卷积神经网络的表情识别方法。针对深层次的3DCNN在特征提取方面更为有效,在网络中添加残差块以简化对深层网络的训练;针对参数多且计算效率低的问题,提出一种伪三维卷积网络来缩减参数,并通过卷积块之间的密集连接和并行特征提取来丰富特征信息,进而研究出一种新型的并行密集三维卷积残差网络算法。(4)多模态情感特征融合:将多模态数据库中的人脸表情和音频作为两类模态,研究基于特征层和决策层的不同模态融合方式,旨在改进传统的多模态融合方法,提出了将特征层和决策层两种融合方式相结合的多模态情感识别方法,实验结果表明多模态情感识别方法的性能明显优于单模态情感识别方法。
其他文献
智能优化算法在控制器参数整定优化领域得到了日趋广泛的应用。其中新兴的鲸鱼优化算法(Whale Optimization Algorithm,WOA)由于结构简单、参数少、搜索能力强等特点受到了广泛关注。但WOA算法由于提出时间不长,其应用研究仍在初步阶段,算法本身还存在迭代精度较低,迭代后期易陷入局部最优等缺点。本论文针对鲸鱼优化算法所存在的不足,提出一种改进的鲸鱼优化算法(LOWOA),并将其应
滚动轴承广泛用于旋转机械中,其失效会导致生产率损失和较高的运行成本。因此,轴承的故障诊断对于确保高性能传动至关重要。最近,各个领域都成功开发了用于轴承故障诊断的数据驱动方法。但这些方法仍然存在很大的局限性,例如在训练数据和测试数据具有相同分布的情况下训练此类模型。这极大地限制了数据驱动模型的广泛应用,特别是基于神经网络的故障诊断模型。因为当操作环境和条件发生变化时,上述方法往往无法检测到故障。为了
随着我国高等教育的发展,在高校大量扩招、大学生数量激增的同时,逃课、挂科等现象开始出现,这严重影响了学生的学业与学校的校风。因此,进行有效的学业预警变得越来越重要。为了保障学校教学质量,督促学生学习,本文给出了融合考勤预警与挂科预警的学业预警方案。通过人脸识别的方式进行学生考勤,根据考勤情况生成考勤预警;并基于学生的考勤情况以及历史考试成绩等数据,利用机器学习对当前学期的课程进行挂科预测,根据预测
车辆数量的增长趋势很快,促进了交通基础设施的建设和发展。为了提高交通效率,方便人们出行,有关人员着力研究智能交通监测系统。智能交通监测系统的重要性日益凸显,而车辆跟踪是其必不可少的组成部分,因此研究车辆跟踪有重大意义。针对车辆跟踪所面临的各种问题,论文提出了一种基于深度学习和核相关滤波的车辆跟踪算法。利用改进的YOLOv3网络检测车辆的位置,在跟踪过程中根据更新策略不断调整核相关滤波的跟踪框,从而
在电子信息产业高速发展的时代,印刷电路板(printed circuit board,PCB)作为电子设备中最为基础且不可替代的一部分,在国内外有很大的应用市场。为了适应工厂高质量快速的PCB生产现状,避免因PCB质量不合格而导致对电子器件的使用寿命与使用的稳定性造成影响,需要对PCB进行高效且准确的缺陷检测。如今通过人工目检的方法已逐渐被淘汰,而基于机器视觉的智能化检测方法因检测速度快、准确率高
在无线通信领域中,调制识别是非合作通信的重要组成部分。通信技术的发展,带来的多样化信道环境,使调制识别变得越发困难。随着深度学习的出现,其在图像和语音识别方面取得了很好的效果,深度学习可以解决有效特征提取的困难,利用深度学习进行调制信号的自动识别已成为通信领域重要研究方向。首先,介绍了调制模式的基本原理和深度学习的理论,引出了常见的深度学习神经网络模型,并分析了不同神经网络模型的优缺点。然后,提出
随着教学改革的深化与深度学习的推进,校本课程逐渐成为基础教育学校教学内容的重要载体和特色化办学的突破点。学校可从明确育人目标、界定分类标准、把握课程功能、强化内容设计、开展科学评价、打造项目团队等方面切入,探索与改进校本课程的开发、设计与实施,真正实现学生核心素养的落实和德智体美劳的全面发展。
目的探讨抗-CD38单克隆抗体对输血前检测实验的干扰及其处理措施。方法收集2名接受抗-CD38单克隆抗体治疗的多发性骨髓瘤患者血样,分别进行ABO和Rh血型抗原定型、直接抗人球蛋白实验、不规则抗体筛选和鉴定、交叉配血实验;将不规则抗体筛选用试剂红细胞、抗体鉴定谱细胞、交叉配血用的献血者红细胞、平行对照用的O型K(+)E(+)红细胞与0.2 mol/L的DTT按照红细胞:DTT为1∶4的比例进行混合
在当今时代,图片作为信息存储和交流的最直观和方便载体,在互联网上大量的传播,图片数据的数量爆炸式增长,以此为前提图像检索任务的需求是目前的重要课题。水利行业伴随着水利信息化的推进,越来越多的监控摄像头被用于记录各水利设施的运行情况,同样产生了大量的图片数据。由于需要对这些水利图像数据进行智能化分析,水利图像检索方法也被迫切需求。基于哈希的图像检索方法和卷积神经网络结合后产生了深度哈希方法,能够满足
随着数字化科技的不断发展,数字图像信息因其具有较强的综合性和直观性等特点,在日常生活的各方面如通讯、教育、医疗等方面都得到广泛应用。同时,数字图像在存储、传输的过程中有可能会受到攻击者的非法盗取或篡改,这将损害合法信息持有者的利益,故研究出安全可靠的数字图像加密方案至关重要。因此,近年来很多信号处理的方法被应用到图像加密中,例如傅里叶变换、离散余弦变换、梅林变换、混沌映射及它们的分数阶版本等,但深