基于深度学习的实时头部姿态估计方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:hyper11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类行为及意图分析在人工智能领域重要性的提高,头部姿态估计逐渐成为一个热门的研究课题,各种各样的方法也被提出以提高头部姿态估计的精度。但是,目前头部姿态估计领域仍存在一些未被解决的问题。被广泛使用的方法比如基于3D头部模型的方法或者基于分类与回归的方法,不能体现头部姿态变化的连续性。而且现有数据集未能包含现实中全部头部姿态,绝大多数数据集要么缺少部分头部姿态样本,要么部分头部姿态样本过少。根据对现有头部姿态估计方法进行总结分析,本文做出了以下贡献:第一,本文使用标签分布取代单标签为头部姿态三个姿态角标注,并提出了平滑性损失。本文使用高斯分布将单个标签转换成标签分布,高斯标签分布的连续分布特点正好契合头部姿态连续变化的特点。此外,基于高斯标签分布的平滑性损失可以学习具有相近姿态角标签的样本,并帮助某些样本数量较少的角度学习准确的标签分布。第二,本文对Kappa系数加以改进以评估预测标签分布与真实标签分布的一致性,并且基于改进的加权Kappa系数提出了一致性损失。此外,本文针对错误程度不同的预测标签给予了不同程度的惩罚,这能使得预测标签倾向于多个相近的角度而不是单一角度,进一步使预测标签分布更加接近真实标签分布。第三,本文将残差学习的思想运用到注意力机制,搭建了多级通道空间残差注意力网络,并构建了头部姿态估计新框架。多级通道空间残差注意力网络以残差连接的方式,在Res Net-50网络各个层次加入通道空间联合注意力,这样做既保留了特征信息又增加了特征鉴别性。通道空间联合注意力模块,顾名思义,从通道和空间两个维度关注局部信息。其中,通道子模块使用深度卷积独立地对每个通道进行加权,空间子模块使用最大池化和平均池化聚合空间信息,且结合通道分组策略来获取不同语义的子特征。最后,本文提出的头部姿态估计框架在具有挑战性的AFLW2000和BIWI两个数据集上取得了先进的结果。
其他文献
1994年现实虚拟连续体概念被提出,这构成了虚拟现实技术领域的开端,随着先进的计算机视觉技术和芯片技术的持续发展,混合现实系统被不断的整合,逐渐高度集成化,因此在诸多领域出现各种混合现实设备。远程合作作为伴随着工业转移而生的新兴领域受到诸多关注,混合现实设备具备高度的沉浸性、直观的显示能力和人性的交互模式等特性,因此将混合现实与远程合作相结合将产生巨大的实用价值。本论文主要围绕着基于混合现实的远程
航空发动机是现代航空产业中的最为重要的机器,对于控制系统而言,发动机是一种拥有多变量、强非线性和不确定性的复杂对象,发动机控制系统性能的优劣将不仅直接影响到飞机的飞行可靠性和经济性,甚至会危及飞行员的生命安全,所以研究先进的发动机控制技术具有很高的实际意义和理论价值。本文以某型号涡扇发动机为研究对象,以稳态工况点处的发动机模型为被控对象,使用抽功法建立其数学模型用于控制方法的设计。本文的主要工作一
如今,随着互联网行业的发展壮大,一个又一个的软件产品相继问世。互联网和软件不断改变着人们的认知和生活方式,也提高了人们的生活质量,与此同时,人们对软件的功能、性能以及实用性有了更高的要求。企业面对日益增长的业务需求,软件系统也逐渐变得复杂,随之软件测试工作也会越来越繁杂,使得软件测试在软件生命周期中占据着越来越大的比重。此时传统的手工测试已经不能满足软件测试的需求,自动化测试的重要性越来越突出。而
共形承载天线是一种具备电磁辐射和结构承载功能的结构功能件,具有体积小、重量轻、与载体平台共形、雷达反射截面小等特点,在航天航空领域具有广阔的应用前景。微滴喷射三维打印是制造共形承载天线的一种可行技术途径。与传统的平面叠层三维打印不同,共形承载天线需在曲面上实现介质基板和导电图形的打印以保证其电性能,因此曲面上微滴的精确铺展就成为影响成形精度和性能的关键问题之一。本文分析了非展开曲面上微滴铺展的关键
本文将研究分布式电子侦察预处理系统中的相关技术,构建完整的雷达脉冲信号预处理系统,并对相关技术进行改进。在预处理系统中,首先对截获雷达脉冲信号进行分解处理,使用分解后的信号计算得到雷达脉冲基本参数,将其组成脉冲描述字(PDW),为后续主处理提供数据支持。同时对原始信号数据进行压缩处理,用于后期进行分布式定位所需的脉冲到达时差(TDOA)估计。电子侦察预处理的关键技术主要包括:数字信道化技术、雷达脉
作为计算机视觉领域的重要研究方向之一,阴影检测旨在精准识别图像中的阴影区域,其在环境光场估计、视频跟踪、目标检测、显著性目标检测等高层图像处理应用中起着至关重要的作用。近年来,随着深度学习技术的快速发展,基于深度学习的阴影检测方法取得了突破性的进展。然而,这些方法仍然存在一些局限性,如网络模型结构复杂,参数量庞大,过度依赖于大规模的训练数据和相应的像素级阴影标签等。针对上述现有阴影检测方法存在的问
车联网(Internet of Vehicles,Io V)的快速发展使得车载应用层出不穷,其中不乏时延敏感型和计算密集型应用。然而计算资源受限的车辆往往无法满足这些应用的时延要求。将边缘计算技术与车联网结合能够有效解决这个难题。通过边缘计算技术实现车辆任务卸载,并利用路边单元配备的边缘服务器的资源协助车辆处理任务,可有效满足车载应用的时延要求。现有车辆任务的边缘卸载研究大多考虑静态场景,然而车辆
随着物联网的迅速发展,对物联网最重要的技术组成——嵌入式系统的性能要求越来越高。微处理器作为嵌入式系统的核心,一直是人们研究的重点,其低成本、低功耗的要求使得设计者需要从各方面来考虑其设计实现,而ISA和微架构是最明显的两个影响微处理器性能的方面。随着传统的标量处理器无法胜任某些特定高效的应用场景,以及开源指令集RISC-V凭借其优秀的特性逐渐成为业界拥抱的对象,结合RISC-V指令集和超标量技术
车联网是一种由具有通信、计算、存储、学习能力的移动车辆组成的智能网络系统,可以提升道路安全,改善道路交通管理状况并支持沉浸式的用户体验。但是,对于资源受限的车辆而言,如何处理车辆传感器搜集到的海量数据,以及为需要极大计算能力或超低时延的应用提供服务,是目前车联网领域面临的重大挑战。移动边缘计算作为一种新兴的网络技术,可以有效地提高计算和卸载效率,将其与车联网相结合,能够解决一部分上述问题。然而,实