基于多尺度融合注意力机制的人脸表情识别研究

来源 :微电子学与计算机 | 被引量 : 0次 | 上传用户:markoliu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统卷积神经网络在表情特征提取阶段容易丢失大量有用信息,无法提取到高判别性表情特征,从而导致表情识别率低的问题,提出一种基于多尺度特征融合注意力机制的人脸表情识别方法:首先,采用VGGNet16来提取卷积特征,为了避免表情特征信息的丢失,将网络中不同层次卷积层的输出特征图进行多尺度特征融合,引入上下文信息的同时提取更加丰富的表情特征信息;为了能够着重关注关键表情特征,在网络中引入注意力机制,利用分组卷积操作对通道注意力模块进行改进,学习不同通道的权重信息,获取注意力特征图,增强特征的表达能力,抑
其他文献
自2000年以来开始出现的大量仿制景观,从经济、社会、文化和政治各方面重塑了中国的城市空间,但却没有引起学者的普遍关注。以新兴出现的微型仿制景观——佛山日本街为例,运用实地调查和话语分析方法,首先理清佛山日本街的仿制要素及其特征,以及佛山日本街的兴起原因,其次利用社交平台的文本数据分析新媒体影响下佛山日本街的形象塑造,进而探讨佛山日本街不同形象的产生根源。研究发现,佛山日本街的仿制要素虽受到日本城
期刊
石英是一种在地壳上大量分布,有着广泛工业用途和广阔应用前景的矿物。当石英晶体形成演化时,受结晶时环境条件、流体性质、结晶后遭受改造(如变质作用、构造变形和热扰动等)等影响,杂质元素如P、Ti、Ge、Al、B、Be、Ca、Na、K、H、Li等会或多或少的存在于石英晶体中,因此在自然界不存在纯SiO_(2)组分的石英。同时,基于石英的微量元素组成,可以反演石英源区和形成演化过程,并用于研究岩石成因、矿
期刊
南秦岭地区下寒武统黑色页岩是我国主要的富钒层位,其中千家坪大型钒矿是典型代表。矿体主要赋存在水沟口组第一岩性段的碳硅质岩石中。为了探讨钒矿的成矿物质来源和南秦岭早寒武世古海洋氧化还原环境,本文对水沟口组第一岩性段富钒碳硅质岩和上覆的第二岩性段泥质灰岩开展了岩石地球化学研究。第一岩性段碳硅质岩具有比第二岩性段泥质灰岩更高的Y/Ho比值,说明碳硅质岩主要为海水自生沉积形成的,而泥质灰岩的物质组成主要来
期刊
(意义)位于南秦岭武当地区的天宝铌矿床是我国典型的碱性火山岩型铌矿床,但其岩浆成因、演化及成矿机理等方面的研究十分薄弱。天宝碱性火山岩主要可以分为粗面质岩石和碱性玄武岩两大类,两者在空间上紧密共生。(方法)本次研究在详细的岩(矿)相学及榍石显微结构研究的基础上,利用LA-ICP-MS分析技术对天宝粗面质火山岩中的榍石进行原位U-Pb定年,并利用EPMA对不同岩性中不同产状的榍石进行原位地球化学成分
期刊
高位岩崩作为高山峡谷区、海岸、交通廊道、露天矿山常见的地质灾害类型之一,具有泛生性、突发性、隐蔽性及致灾严重性等基本特性。近年来,伴随全球地震频发和气候急剧变化,高位高能岩崩事件显著增多,造成严重的生命财产损失。目前,高位高能岩崩识别和预警技术、失稳和运动机理、灾害链效应成为国际地球科学领域的研究热点之一。本文从岩崩早期识别、失稳和运动机理、综合防护技术措施等方面归纳总结了目前的主要研究成果,并提
期刊
为了解决现有算法在检测高分辨率交通标志图片时速度过慢或精度不足的问题,本文对YOLOv4算法进行了优化。以MobileNetv3-Large为底本,针对数据集的特点舍弃部分耗时层并重新设计了注意力模块,由此得到了更轻量化的主干网络。同时在检测头前加入基于弱语义分割的动态增强附件,利用其输出作为空间权重分布来矫正激活区域,以抑制追求轻量化带来的提取能力下降导致的误检、漏检问题,最终形成了YOLOv4
期刊
疲劳驾驶是导致交通事故的重大诱因,而降低交通事故发生的概率是交通系统的重要研究领域之一,结合当下的车辆驾驶实际情况,提出针对特定司机的疲劳检测方法。该检测方法首先存储该车司机正常状态下的面部信息,然后利用MTCNN网络检测摄像头所读取画面中的人脸,返回出人脸的位置信息,其次通过全梯度下降树算法根据人脸位置信息得到驾驶人面部特征点,利用特征点中存储的信息判断眼部与嘴部的状态,最终与被检测司机的正常状
期刊
为保证在边缘设备上运行深度神经网络模型并进行实时性分析,需对网络模型进行压缩以减少模型参数量和计算量,而现有剪枝算法耗时时间长并且模型压缩率低。为最大限度剪除冗余的参数,在结构化剪枝算法中对神经元进行细粒度评价,采用神经网络的梯度信息衡量权重的重要性,通过步进搜索和计算曲率的方式获取不同网络层的剪枝权重阈值,对剪枝后的网络进行恢复精度训练保证模型精度。实验结果表明,该算法在保证模型精度的同时,能够
期刊
为了在场景图生成网络中获得更好的上下文信息,同时减少数据集偏差的影响,提出一种结合外部知识库和适应性推理的场景图生成模型,模型由三个部分构成。首先是结合外部知识库的目标检测模块,为模型提供语言先验知识以提高关系检测的准确性。其次,设计一种基于Transformer架构的上下文信息提取模块,通过两个Transformer编码层对候选框和实体对关系标签进行处理,利用自注意力机制分阶段进行上下文信息的合
期刊
针对服装图像分割领域存在的服装边缘分割粗糙、分割精度差和服装深层语义特征提取不够充分等问题,本文将Coordinate Attention机制和语义特征增强模块(SFEM)嵌入到语义分割性能较好的Deeplab v3+网络,提出了一种用于服装图像分割领域的CA_SFEM_Deeplab v3+网络。为了加强服装图像有效特征的学习,在Deeplab v3+网络的主干网络resnet101嵌入Coor
期刊