【摘 要】
:
21世纪以来,情感识别逐渐受到相关研究人员的关注,并成为人机交互领域重点的研究对象。虽然针对情感识别领域已经有了大量的相关工作,然而目前仍有许多尚未解决的问题。首先,目前工作大多仅仅局限于音频、文本或视频等单一的模态信息,最终的识别性能往往不尽人意。其次,尽管当前部分工作也开始尝试从多模态的角度来提高识别准确性,但是针对多模态的情感识别任务,当前工作往往很难找到一种令人满意的特征提取方法,也难以在
论文部分内容阅读
21世纪以来,情感识别逐渐受到相关研究人员的关注,并成为人机交互领域重点的研究对象。虽然针对情感识别领域已经有了大量的相关工作,然而目前仍有许多尚未解决的问题。首先,目前工作大多仅仅局限于音频、文本或视频等单一的模态信息,最终的识别性能往往不尽人意。其次,尽管当前部分工作也开始尝试从多模态的角度来提高识别准确性,但是针对多模态的情感识别任务,当前工作往往很难找到一种令人满意的特征提取方法,也难以在特征融合过程中很好地对各模态的信息进行综合表示,不能合理地对不同模态之间的内在联系进行建模。因此,目前情感识别领域仍然需要进行更深入的研究。针对情感识别领域目前存在的关键问题,本文从音频、文本以及视觉等与人类情感息息相关的不同模态信息出发,对各单一模态的情感识别任务进行研究,并在此基础上进行相关模态的特征提取,同时将以上情感特征进行融合,通过联合音频、文本以及视觉等不同的信息对最终的情感进行预测。本文主要工作可总结如下:1.本文研究的主题是多模态情感识别,研究对象包括语音、文本以及视觉信息。首先针对单模态情感识别问题进行探索,以寻找适合不同模态的深层情感特征提取方法。2.对于语音情感识别任务,使用语谱图的方法来更好地对语音信号进行表征,同时提出了基于语谱图的VGG-LSTM模型,并在语音情感识别任务上取得了较好的识别性能。3.对于视觉情感分析任务,主要对人脸表情所反映的情感进行研究。考虑到眼睛、嘴巴等局部区域能更好地反映出相关表情,本文针对表情识别任务引入了一种新的特征提取模块。该模块区别于传统的卷积核,可以以一种自下而上的方式自适应地确定卷积核权重,从而对脸部的不同区域分配不同的注意力。基于该模块,本文搭建了针对表情识别任务的ATB-Net网络,取得了良好的性能。4.现有的多模态情感识别研究往往通过提取大量特征来识别情感,但过多的特征会导致一些关键特征淹没在相对不重要特征里。为解决该问题,针对音频、文本以及视觉等三种不同模态的信息,本文提出了一种全新的情感特征融合方法,即使用交叉注意力对不同模态信息间的潜在联系进行建模。实验结果表明,该算法可以取得比各单模态情感识别算法更好的性能。
其他文献
全无机铅卤钙钛矿材料不仅具有光致发光量子效率高,非辐射复合率低,直接带隙可调等优异的性质,还具有非常好的稳定性,是一种极具潜力的光电材料,在太阳能电池,光电探测器,发光二极管等方面具有巨大的应用前景。本论文采用化学气相沉积(Chemical vapor deposition,CVD)方法,通过调控实验参数,合成了方形微米片、棱台和三角锥三种稳定形貌的高质量CsPbBr3微米晶,并对其结构和发光性能
深度学习领域中,时间性能以及准确率是评估一个模型好坏的两个最为关键的指标。近几年,图神经网络由于能够很好的处理其他深度学习方法无法很好处理的非欧氏空间数据而得到了迅猛发展。目前图神经网络领域的研究者们更多地关注图神经网络模型的准确度而忽略了对于图神经网络模型的时间性能的研究。图神经网络为了处理非欧式空间的图数据,其模型结构及训练过程相比于已有的深度神经网络有着很大的区别,并因此具有了很多新的性能特
波分复用技术是为了提高光通信系统的传输容量和带宽,适应指数级网络流量增长的需求而研发的,但是,在非线性光纤传输的香农限制下传统波分复用系统的容量几乎达到了极限。要进一步提高系统的数据传输能力,提高单个波长信道的容量,研究人员先后提出了新的复用技术:偏分复用和模分复用等技术。偏分复用和模分复用技术利用双偏振以及模式技术,在多个波长上来实现并行通道数据传输,这些技术不仅可以节省物理空间,还可以降低系统
问题是理论创新的着眼点,是实践变革的着力点,深入研究和解决问题才能把握现实、赢得主动、开创未来。党的百年奋斗征程中始终不忘认识和解决问题,始终把问题作为践行初心使命和接续筚路蓝缕的切入点,重视问题和回应问题是中国共产党长期以来不断从胜利走向新的胜利的重要历史经验。习近平赓续党关注问题的历史传统,不断在实践发展和人民期盼中提炼时代真问题,不断在党的战略方针、方案举措和重要论断中提出一系列中国式的问题
近年来,随着移动智能化终端的逐步普及,人们对于室内精准定位的需求愈发强烈。根据研究,信号的定位精度与其可用带宽资源成正比。因此,毫米波作为市面上可用带宽最大的一款信号,拥有着理论上最高的定位精度。然而,毫米波容易被障碍物阻挡,在无外物辅助的情况下,难以在非视线场景中使用。研究人员曾提出使用环境反射(即墙面对信号的镜面反射)来进行定位,但是会出现反射点较少而导致定位精度不足的情况。在本文中,我们根据
目的:探讨甲状腺功能正常的多囊卵巢综合征(Polycystic ovary syndrome,PCOS)伴不孕患者中甲状腺自身抗体及其滴度对其体外受精胚胎移植(In vitro fertilization and embryo transfer,IVF-ET)助孕结局及卵巢储备的影响。方法:回顾性分析2017年1月1日至2019年12月30日于“烟台毓璜顶医院生殖中心”进行IVF-ET助孕的甲状腺
基于正交试验方法,分析了金属齿形密封垫片的结构参数,即齿高、齿厚、齿距、齿顶宽和圆角半径等,并且研究了其对金属齿形密封垫片密封性能的影响。首先采用ABAQUS软件对密封垫片进行了有限元分析,再计算得出其压缩率和回弹率,用正交试验方差分析法判断各结构参数对其压缩率和回弹率的影响,并通过综合评分法的极差大小判断各结构参数的主次性。最后确定了具有良好压缩率和回弹率的齿形密封垫片的各关键尺寸参数。结果表明
目的:探究失眠导致记忆力减退的机制以及元七胶囊改善失眠小鼠记忆力的机制,并为研制治疗失眠导致记忆力减退的新药提供依据。方法:(1)将40只无特定病原体的雄性昆明小鼠随机分为AB两组:A组灌胃生理盐水,B组腹腔注射对氯苯丙氨酸混悬液,制备失眠小鼠模型。(2)运用离子轨道阱质谱仪对AB两组小鼠的海马组织进行蛋白质组的分析,并对获得的差异蛋白进行富集分析和代谢途径分析。(3)利用水迷宫验证元七胶囊对失眠
数据的多样性是大数据的主要特性之一,它使得越来越多的数据呈现出异构性和多模态特性。例如,在电子商务应用中,一个商品往往同时通过文本、图片、视频等多种模态的信息加以描述。传统的文本搜索引擎主要面向文本数据,无法有效地对多模态数据进行信息抽取、索引构建以及高效搜索。目前,越来越多的应用提出了多模态数据高效存储与管理的需求,例如电子商务、智慧医疗等。因此,研究面向多模态数据的高效数据管理技术具有十分重要
在多智能体系统中,多智能体路径发现(Multi-agent path finding,MAPF)是一个具有挑战性和有意义的问题,其中要求所有智能体在不相互碰撞和避免障碍的情况下有效地达到其目标地点。有效地提取和表达智能体的观察结果、有效地利用历史信息以及与相邻智能体之间的有效通信是完成多智能体协作任务所面临的挑战。尽管传统的搜索算法采用了诸多技巧来改善求解的效率,但是在环境规模较大时,难免会面临搜