【摘 要】
:
随着信息时代的革新以及人工智能的发展,更复杂和更友好的人机交互需求应运而生。作为一种跨语言的传递方式,人脸表情是实现机器理解人类情感的重要数据基础。人脸表情识别可以广泛应用在公共安全、医疗诊断、商业营销和虚拟现实等众多场景。近年来,深度学习方法由于强大的特征学习能力,依托高性能的计算资源显著提升了表情识别的准确率。然而,面对现实世界中爆发式增长的数据,个体差异、复杂场景和不确定性等普遍存在的问题严
论文部分内容阅读
随着信息时代的革新以及人工智能的发展,更复杂和更友好的人机交互需求应运而生。作为一种跨语言的传递方式,人脸表情是实现机器理解人类情感的重要数据基础。人脸表情识别可以广泛应用在公共安全、医疗诊断、商业营销和虚拟现实等众多场景。近年来,深度学习方法由于强大的特征学习能力,依托高性能的计算资源显著提升了表情识别的准确率。然而,面对现实世界中爆发式增长的数据,个体差异、复杂场景和不确定性等普遍存在的问题严重影响了表情识别方法的性能。针对上述挑战,本文结合心理学、生理学和认知神经科学等交叉学科成果,研究基于图表征学习的人脸表情识别方法。论文的主要研究内容和创新如下:1)针对图表征学习这一人脸表情识别研究新趋势,本文全面系统地调研了国内外相关方法,从基础理论、历史演变和发展路径等方面总结和分析了现存工作。重点讨论了图表示和图关系推理两个阶段方法的适用情况、技术优势和局限性,并提出了潜在的研究方向。该工作填补了目前基于图表征学习的表情识别方法综述的空白。2)针对表情行为的个体差异问题,本文提出面部网格图与卷积网络相结合的人脸表情识别方法。该方法根据人脸特征点位置利用三角化和网格化自动划分得到符合面部肌肉解剖的动作单元关联区域;随后,提取每个区域的局部外观特征作为节点属性,同时以三角边连接的人脸特征点欧氏距离作为边属性,共同构建人脸表情的网格图表示;为了从网格图中学习面部情感特征,设计了基于对角卷积、序列卷积和池化操作的深度架构训练图结构数据,从而联合学习人脸表情的局部外观与全局几何信息。该方法利用图结构生成了表情的局部-整体表示,并成功将常规卷积神经网络拓展为适用非网格化输入,实现了精准的表情识别。3)针对实际复杂场景中表情行为的多样性,本文提出基于面部语义图与双流图网络的人脸表情识别方法。该方法借助面部动作编码系统设计了关键人脸特征点选择和增补策略,定位表情行为中的主要贡献区域;进而,探索了融合特征和深度特征两种节点属性提取手段以及欧氏距离和跳跃距离两种边语义索引初始化方案,将外观信息、几何信息和情感语义信息共同嵌入表情的面部语义图表示;最后,通过在图卷积模块中引入注意力机制并构建双流图网络,从面部语义图中学习有效的面部情感特征,进一步提升了多种场景下的表情识别性能。4)针对大规模标签数据集中的不确定样本,本文提出基于辅助动作单元图的表情标签校正方法。受到多任务学习思想启发,该方法会在目标分支自动学习和估计训练数据中的样本置信度,并通过加权排名正则化策略抑制不确定表情样本在模型参数更新时的影响;此外,根据动作单元和表情类别之间的潜在映射关系,引入动作单元检测作为辅助任务,从训练数据中驱动生成动作单元图并使用图卷积网络提取情感语义特征,进而对目标分支发现的不确定表情样本在语义相似约束下进行标签校正,优化模型的特征学习方向,在不增加预测开销的情况下显著增强大规模数据集上的表情识别率。实验结果表明本文研究的基于图表征学习的人脸表情识别方法的有效性和合理性,所提出的三个原创方法能够有效解决表情个体差异、复杂真实场景和数据不确定性等挑战,在限定场景和大规模真实场景数据集上都达到了有竞争力的识别准确率。
其他文献
纳米铜(Copper nanoparticles,Cu NPs)广泛被应用于工业、农业、生物医药、环保等领域。在畜牧业中,纳米铜有良好的抗菌、抗病毒和免疫增强功能,是现有饲料铜源的潜在替代品。但在纳米铜的毒理学研究中,尚未有文献报道纳米铜对孕期动物的毒性及对卵巢中性激素代谢的影响,这导致纳米铜的孕期使用存在安全风险。为此,本论文开展了纳米铜对孕鼠毒性及对卵巢性激素代谢相关细胞色素P450(Cyto
研究报道铜过量可诱导氧化应激、细胞凋亡及炎性反应,进而造成组织结构和功能的损伤。肝脏是机体内铜的主要代谢器官,也是铜中毒的主要靶器官之一。然而,有关铜过量致人和动物肝脏损伤及其作用机制的系统研究仍然缺乏。因此,本试验以ICR小鼠为研究对象,研究硫酸铜(CuSO4)对小鼠肝脏的毒性损伤,包括结构功能改变、氧化应激、细胞凋亡、细胞自噬、炎性反应以及凋亡和自噬在CuSO4诱导肝脏损伤中的作用及其相互关系
近年来,互联网与多媒体信息技术的迅速发展,视频以其直观、信息量大等特点,广泛应用于社会生活的各个领域,成为当今社会信息交流中必不可少的一部分。与此同时,各种视频编辑工具大量涌现,视频篡改变得越来越简单,给视频的真实性、完整性带来巨大威胁。现有针对视频篡改的检测算法往往无法较好抵抗噪声、缩放、压缩等攻击手段,特别是基于深度神经网络的检测算法性能受到对抗样本的影响极大。因此,研究鲁棒的视频篡改检测算法
超分子自组装体系是指不同分子间通过非共价物理作用构建起来的复杂而有序的聚集体。以聚合物为构筑基元之一的超分子自组装体系较传统聚合物的自组装具有较多优势。聚合物型超分子自组装不仅制备过程简易,可调控性强,还可以丰富纳米世界的结构、制备功能性材料,因此这类组装仍然具有较为广泛的研究价值和应用前景。构建超分子体系的常用非共价作用有氢键作用、静电相互作用、疏水作用、主客体识别等,其中静电作用力具有简单、便
随着电子信息技术和微电子行业不断向微型化、智能化和集成化的高速发展,无源电子元器件的基础核心材料——功能陶瓷材料成为无机非金属材料研究中最为活跃的领域。寻求高介电性能功能陶瓷材料是实现元器件微小型化重要研发目标的有效途径之一。类钙钛矿结构的CaCu3Ti4O12(CCTO)基陶瓷巨介电常数高达~104-105,同时在100-400 K温度范围内具有较好的热稳定性,此类无铅多功能陶瓷材料近年来一直得
对话系统作为人机交互的重要接口,受到了学术界和工业界的广泛关注,并在诸多商业场景中得到落地应用。其中,以智能手机助理、车载系统、智能家居、智能客服等为代表的任务导向型对话系统为人们的生产生活带来了诸多便利。任务导向型对话系统旨在以对话的形式协助用户完成一个或多个领域的特定任务,能够提高服务的便捷性,减轻客服负担,降低服务成本。新一代智能对话系统的目标是让人机对话像人与人的对话一样高效、便捷且自然。
蛋白质饲料资源紧缺及排泄物中的氮排放问题制约着我国养猪业可持续发展,饲料蛋白质资源的高效利用已成为动物营养与饲料科学领域的研究热点及前沿。妊娠母猪氮排放占养猪业的比例高达20%,低蛋白日粮技术虽是降低生长猪氮排放的传统技术,但能否适用于妊娠母猪尚不明确。研究已经证实饲粮纤维对妊娠母猪繁殖活动的重要性,饲粮纤维及肠道微生物代谢却显著影响氮的消化与代谢,其是否影响妊娠母猪氮代谢及低蛋白日粮的饲喂效果未
自诞生之日起,中国共产党始终重视工人运动,并把工会事业作为一项极为重要的问题加以对待。中国共产党把马克思主义工会理论与新民主主义革命时期的工会工作和工人运动实践相结合形成了一系列战略方针和理论政策。新民主主义革命时期中国共产党工会理论是马克思主义中国化过程中形成的重要思想理论成果,是中国化马克思主义工会理论的重要组成部分。对新民主主义革命时期中国共产党工会理论进行科学研究是马克思主义中国化学科研究
随着现代社会的不断发展,保险作为一种规避风险的重要投资手段,越来越受到投资者们的欢迎。面对市场上众多的保险公司和保险产品,如何在其中选择合适的产品进行投资组合,成为了很多投资者关注的热点问题。然而,由于保险的收益在不同情境下的差异可能很大,保险投资组合优化问题一般伴随着很强的不确定性。分布估计算法是一种基于概率分布的随机优化算法,由于其自身固有的随机性与问题不确定性之间的一致性,具有很强的处理不确
作为甜菜制糖工业的副产物,甜菜粕是生产甜菜果胶(SBP)的理想原料。通常,果胶具有良好的凝胶性,在食品工业中应用广泛。然而,SBP的物理凝胶性质却不理想,受限于其自身的高乙酰基含量、高中性糖侧链含量以及相对较低的分子量。为了克服这些来自于SBP的凝胶限制条件,改变SBP凝胶性不强的局面,本文围绕SBP构建了系列水凝胶体系,并对其凝胶性质和凝胶机理进行了系统研究,旨在为SBP在凝胶领域的应用提供理论