基于注意力神经网络的多模态情绪识别系统

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:haibitian_lan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情绪,高度概括了人们的主观认知经验,在人与人的沟通中具有重大意义。目前单模态情绪识别研究已经很成熟,但在当今,人们都是通过混合的方式来表达情绪,现有的多模态情绪识别研究在获取各个单模态的情感特征时,往往忽略了情感特征的交互性与完整性,特征的丢失导致模型在准确度和性能方面都有所欠缺;同时,在多模态数据融合的过程中,存在无关信息干扰,且没有最大化的保存各个模态之间的有效交互信息。因此本课题针对上述存在的不足,主要研究内容如下:(1)本文提出了基于卷积神经网路的听觉提取方法,通过端到端的方法解决了特征丢失的问题,也提高了特征提取的准确度和性能。具体做法是在对语音信号进行预处理后,在一个联合训练的模型中学习特征提取和回归步骤,通过对比选择更能代表情绪特点的语音特征合集作为特征提取目标,运用卷积神经网络从语音中提取特征。实验结果验证了该方法的有效性。(2)本文提出了基于注意力机制的视觉提取方法,运用改进后的注意力机制与卷积神经网络相结合的方式,有效减少了无关信息的干扰。具体做法是将卷积快注意模块插入到卷积神经网络中,对卷积层输出的特征图进行注意力加权计算,通过神经网络算出梯度,最后经过一个全连接层转换为一维向量,得到最终需要的图像特征表示。通过实验表明注意力机制有效提高了模型的性能。(3)本文提出了基于注意力神经网络的多模态情绪识别系统(A-CNNM),最大化地保留了有效交互信息。具体做法是运用张量融合的方法对视觉和听觉两个模态进行特征融合,用它们的张量积作为多模态数据的联合特征,并对所产生的冗余信息进行清理降重,在对上下文建模后,运用支持向量机对多模态情感数据进行情绪分类识别。实验结果表明,与现有研究方法相比,在性能上有所提升。(4)验证提出模型的有效性。本文在三个数据集中分别进行听视觉特征提取实验以及多模态情绪识别实验。实验表明,本文提出的基于注意力神经网络的多模态情绪识别系统与主流的各种方法相比,不仅在性能上有了而较大的提升,也极大地简化了算法的难度和复杂度,并且有良好的实时性。
其他文献
牙科树脂以其良好的物理化学性能及容易操作等特点,成功取代了传统的银汞合金成为了目前牙齿修复的首选材料。但树脂修复体的平均寿命仍较大程度落后于银汞合金,其主要原因即材料本身力学性能不足导致的修复体断裂,以及树脂聚合收缩或热膨胀系数不匹配导致的边缘裂隙和二次龋齿等。因此,为了解牙科树脂固化动力学特征,相继诞生了一系列固化监测方法,如差示扫描量热法、动态热机分析法、介电分析法等。但这些方法大多为接触式方
学位
如今,电子商务与人们的日常生活密切相关。电子商务平台提供评论区供用户在线评论,评论数据会长期保存在电商平台上。这些评论对于消费者来说,直接影响到是否选择该商品;对于商家来说,可以了解用户对商品的评价,并及时改进不足。但各个电商平台上的评论区积累的评价内容十分庞大,直接阅读评论十分费力,难以获取有效的信息,不仅降低用户阅读评论的效率,也使得商家难以获取用户反馈的信息,增加改进商品的难度。因此如何在如
学位
三元组到文本生成旨在将知识图谱三元组映射到描述其信息的文本,在普遍使用知识图谱作为信息数据存储的大数据时代下,三元组到文本生成技术不仅可以助力互联网数据分析以提高产能和效率,并且对于自然语言中的结构化与非结构化数据转换研究发展具有重要的实际意义。从知识图谱生成文本是一项基本任务,任务的完成度取决于生成句子的质量以及对信息描述的准确性,以前的研究大多采用标准的序列到序列方法,这不可避免地无法捕获图结
学位
随着我国汽车保有量的不断上升,城市的泊车空间变得越来越紧缺,泊车环境也愈发严苛,特别是在大城市中,安全泊车已经成为困扰人们的问题之一,在交通事故中,因为泊车失误导致的交通事故也屡见不鲜。作为自动驾驶汽车的重要组成部分之一,自动泊车系统在汽车发展行业一直具有广泛的应用前景,也是当前研究自动驾驶以及汽车智能化技术领域的热点。当前自动泊车系统仍存在几个明显缺点:首先,现有自动泊车系统都是基于倒车实现,而
学位
当伺服系统的运行工况发生变化时,如负载转动惯量和负载转矩的改变,会对系统控制的平稳性能产生较大的影响。由此可见,伺服系统的负载鲁棒性是高性能伺服系统的一项重要指标。因此,本文对存在负载转动惯量和负载转矩扰动的永磁伺服系统鲁棒控制进行了研究。首先,本文详细介绍了永磁同步电机数学模型的简化过程,给出了永磁伺服系统的矢量控制架构,并描述了永磁伺服系统的工作原理。为了能够更好地设计鲁棒控制器并分析其性能,
学位
随着社会科技的进步信息时代的来临,我们日常生活中产生了越来越多大规模且高维度的数据。这些数据往往具有物理意义,呈现出非负性,我们称为非负张量数据。非负张量数据中有许多有价值的非负信息,因此对非负张量数据进行特征提取是分析与挖掘潜在信息的必要手段。在特征提取领域中,非负张量分解是一种进行特征提取的有效方法,它可以直接对张量数据进行表征,所以被研究人员广泛的使用。但是对于经典的非负张量分解算法来说很难
学位
随着社会经济的持续发展,我国对电能的需要日益提高。在较为发达的地区,由于架设新输电线路难以实现及各种条件因素的制约,导致用电形势日益严峻。然而架空线路的载流量大小除了与导线自身的性质有关外,还与气象条件存在密切的关系。同时,人工智能算法在气象数据的统计分析方面有着巨大的优势。因此,如何使用人工智能的相关算法有效地挖掘架空线路的载流能力以满足人们日益增长的用电需求成为了架空线路运维领域亟需研究和解决
学位
近年来,社会的发展给人们各方面生活都带来了很大的改善,但也因此打乱了人们从前的工作生活规律,现今越来越多不规律的生活作息现象在年轻一代中显现,导致了各种疾病的产生。脑肿瘤作为致死率较高的人脑部疾病,也渐渐向年轻一代转移,垂体瘤便是其中一种常见的颅内脑肿瘤。核磁共振成像(MRI)技术由于其高质量、高分辨率、多模态等特点,被广泛应用于临床脑部医学成像。但关于如何将得到的脑垂体瘤MRI影像中垂体瘤部分分
学位
微小故障的诊断对保障现代工程系统的可靠性和安全性具有重要意义,也是故障领域很有挑战的任务之一。早期的微小故障如果未被检测出来,可能会演变成其他类型的故障,轻则损害系统的性能,严重时会导致系统瘫痪失效,引发灾难性的事故。比如在发动机旋转失速的诊断中,如果能够及时准确检测出旋转失速,防止喘振现象的发生,就能很好预防飞机出现重大事故,这对保障航空发动机安全稳定运行具有重大意义。随着信息技术和故障诊断领域
学位
随着大数据时代和电子信息技术的飞速发展,多视图数据的身影时常出现在不同领域的科学研究和各种实际应用场合中。与单视图数据相比,多视图数据因为可以提供更多对学习任务有用的信息,所以对于聚类和分类学习任务具有更好的性能,因此多视图学习一直是人工智能和数据挖掘等众多领域的重要研究方向。近年来,基于张量奇异值分解(t-SVD)的多视图聚类算法,充分利用张量数据的低秩特性,可以更高效、更彻底地探索多视图数据之
学位