【摘 要】
:
随着互联网在世界范围内的快速普及以及海量图像和视频数据的日益增加,如何利用人体分析相关的智能算法处理这些数据已经成为互联网向智能化方向转变的关键。本文研究的单人体姿态估计任务是各种人类行为分析任务的基础,其主要目标是检测人体的姿态,而人体关节具有极大的自由度,且在实际场景中极易被自身或者其他物品遮挡,因此需要更鲁棒的人体姿态检测算法。目前,单人姿态估计任务多数是基于卷积神经网络来提升人体姿态检测的
论文部分内容阅读
随着互联网在世界范围内的快速普及以及海量图像和视频数据的日益增加,如何利用人体分析相关的智能算法处理这些数据已经成为互联网向智能化方向转变的关键。本文研究的单人体姿态估计任务是各种人类行为分析任务的基础,其主要目标是检测人体的姿态,而人体关节具有极大的自由度,且在实际场景中极易被自身或者其他物品遮挡,因此需要更鲁棒的人体姿态检测算法。目前,单人姿态估计任务多数是基于卷积神经网络来提升人体姿态检测的准确性,由于其隐式学习的过程可解释低,导致人体姿态估计算法易出现不符合人体拓扑结构的检测结果。本文针对上述问题提出了一种基于全局特征信息引导的单人姿态估计方法,该方法在保持算法轻量化的同时,有效地提升了人体姿态检测的准确性。另外,针对实际场景应用困难的问题,本文提出了一种基于姿态相似性的动作检测算法。因此本文工作主要围绕以下两个方面来完成:首先,本文针对人体姿态估计模型缺乏领域信息引导,而出现不符合人体拓扑结构的检测结果的问题,提出了一种基于全局特征信息引导的单人姿态估计方法。该方法利用卷积网络深层特征符合某种抽象语义信息的特点,设计了全局人体拓扑结构的监督模块,以实现对人体拓扑结构的显式建模。同时利用全局特征信息和注意力机制引导浅层的特征的方式抑制不符合人体拓扑结构的检测结果,最终实现了准确预测人体关节点的效果。另外,本文针对单人姿态估计任务中的遮挡问题,提出了一种基于人体姿态相似性算法的网络学习方法,该方法主要思想为利用相似姿态中简单样本帮助困难样本预测被遮挡的关节点。实验表明,该方法能有效对困难的关节点进行合理地推理,同时也提高了单人姿态估计模型的准确率和泛化性能。其次,针对人体姿态估计任务在实际场景应用困难的问题,本文提出了一种针对特定场景下基于人体姿态相似性算法的动作检测方法,并应用在实际产线场景中的工序动作分割任务上,该方法面向的是视角没有太大变化且相对固定的场景,同时利用关节点坐标和关节角度信息来加强姿态相似性算法的通用性,在具有连续姿态的视频动作序列上,有效解决了因姿态连续导致人体姿态一部分过于相似而引起错检漏检的问题,取得了不错的实际效果。综上所述,本文提出的基于全局特征信息引导的单人姿态估计网络以及基于人体姿态相似性的网络学习方法能够有效提升检测人体姿态估计的效果,并且在实际场景中的应用也具有良好的效果,具有重要的研究意义和实际场景的应用价值。
其他文献
由于独特的成像技术,高光谱图像数据呈三维立方体结构,包含了丰富光谱信息,并且在生物医学分子检测、植被生态监测、食品安全检测等领域获得广泛应用,其中目标检测是最重要且广泛的应用之一。然而,由于GPS定位的精度问题,高光谱图像中被标记为目标的像素点与地面真值中的目标位置并不一致,存在一定的偏差。真实的目标一般会存在于包含该像素一定范围的区域内。此外,目标像素和非目标像素在数量上存在严重的不平衡也是高光
近年来,人工智能快速发展且与多种应用深度融合。但由于计算模型复杂、海量数据标注困难、计算资源消耗大等问题,导致人工智能无法真正开启“机器智能”新纪元。随着脑科学的深入研究,许多研究学者逐渐意识到类脑智能将是打破人工智能桎梏的重要方式,因此通过模拟脑网络的运行机制来构建类脑智能网络是当下研究的热点。基于此,本文在理解大脑“智能”关键机制的基础上,结合脑科学最新研究成果,对神经环路与信息表征之间的关系
随着信息技术、传感技术的飞速发展,人们描述目标的方式逐渐从过去的单一视图转变为现在无处不在多视图,比如,描述一个网页可以从网页的logo、图片和网址等角度来描述。相较于传统的单视图数据,多视图数据对于目标任务(比如人脸识别、数据标注等)具有更好的表达能力。然而人们在实际应用场景里获得的多视图数据具有样本数据量大、无标签等特点。已有的人工智能算法直接利用这些数据分析目标任务时,算法性能退化明显,严重
随着云服务的发展,人们在享用云提供的强大计算能力和存储能力的同时,云端数据的安全问题也随之暴露。同态加密不同于传统加密方案,可以在保护数据存储安全的同时,不丢失计算能力。因此,在云服务飞速发展的当下,同态加密技术具有很高的研究和应用价值。全同态加密从提出到现在已有十多年,因为效率问题,过去一直处于理论阶段。近些年来,由于全同态加密理论上的突破以及硬件设施的迭代,全同态加密的效率问题得到了一定程度上
随着对微型移动终端设备的电源要求日趋提高,锂电池因其体积小、能量密度高等优点,成为移动设备的首选电源。又随着移动设备应用环境的多元化,对锂电池充电方案的设计提出了更高的要求:(1)考虑更低的成本和更高的良率,设计上需要更简单的电路结构。(2)随着供电电压的多元化,对芯片的耐压要求也随之提升。(3)需要在诸多环境下进行充电检测,对测试模式下的环路安全和稳定性问题也日趋重视。(4)充电电压和电流的精度
RFID(Radio Frequency IDentification)是一种无需物理接触即可实现对指定实体自动识别的技术,它通过射频信号与附着在实体上的RFID芯片建立连接,并从中获得有关的数据信息,在物流、交通运输、医疗设备管理等多个领域得到了广泛的应用。但是在RFID系统中标签和阅读器采用无线的方式进行会话,很容易遭遇各种非法的攻击,例如追踪、截获、信息泄露、欺骗等,而且在一些应用中标签的所
随着电子信息和遥感技术的发展,遥感图像有着越来越广泛地运用,其在城市规划、资源勘探、军事目标识别等领域都有着十分重要的意义。但遥感图像也易受环境或拍摄设备等外界条件的影响而呈现出低画质的情况,进而影响后续对图像的处理和分析。在本文中,主要研究的是如何针对低质量的遥感图像进行目标检测任务。本文的主要研究内容如下:1.本文第一点针对低质量遥感图像,提出了一种基于传统方法与Retinex图像增强算法的条
移动自组织网络(Mobile Ad Hoc Network,MANET)是由一组自治的设备或者节点组成的即时性的网络系统,具有不依赖基础设施、易部署、无中心、自组织、高动态等特性,可以不受时间、空间及环境等因素的限制为用户提供有效的通信服务。MANET广泛应用于军事、日常生活及抗险救灾等领域,既可以独立成网也可以与因特网(Internet)、物联网(Internet of Things,Io T)
随着芯片集成度的提高和片上系统(SOC)的发展,电源噪声和不同模块之间的干扰变得非常严重,需要干净的电源电压来为这些模块供电。低压差线性稳压器(Low Dropout Regulator,LDO)因为其较低的电路噪声以及较高的电源抑制比,成为了为这些模块供电的主要选择。本文针对双同步低压降型DC-DC控制芯片的研发需求,选用SMIC 0.13μm CMOS工艺设计一款高电源抑制比的无片外电容LDO
行人重识别技术可以搜索特定行人,被广泛用于现在的智能视频监控系统中,辅助人们抓捕罪犯或寻找失踪人员。遮挡行人重识别任务的提出主要是由于现实世界中行人往往被各种遮挡物所遮挡,极大地影响了模型匹配的精度。目前针对遮挡行人重识别任务的工作依旧面临巨大的挑战,早期的大多工作只关注人体匹配并未考虑遮挡问题,后来出现了基于局部特征的方法,使得模型的泛化性能有所提高,但这类方法大多需要严格的行人对齐,严重遮挡下