【摘 要】
:
人体姿态估计任务是计算机视觉任务的热点之一,主要包括对图像或者视频中的人体和人体关键点的准确定位,进而估计恢复出人体姿态的任务。在运动建模、监控安防、行为动作分析和人机互动等领域,人体姿态估计都具有广泛的应用价值。在实际生活中,受拥挤人群遮挡、光线因素变化以及各种复杂场景等的影响,人体姿态估计一直存在着一些普遍和典型的问题和挑战。基于这些问题和挑战,本文在学习总结了相关领域知识方法的基础上,利用深
【基金项目】
:
陕西省重点产业创新链项目,2019ZDLGY09-05,面向高分辨SAR图像目标识别的量子深度神经网络技术研究; 国家自然科学基金面上项目,61772399,面向高分辨SAR图像分类的量子深度神经网络研究;
论文部分内容阅读
人体姿态估计任务是计算机视觉任务的热点之一,主要包括对图像或者视频中的人体和人体关键点的准确定位,进而估计恢复出人体姿态的任务。在运动建模、监控安防、行为动作分析和人机互动等领域,人体姿态估计都具有广泛的应用价值。在实际生活中,受拥挤人群遮挡、光线因素变化以及各种复杂场景等的影响,人体姿态估计一直存在着一些普遍和典型的问题和挑战。基于这些问题和挑战,本文在学习总结了相关领域知识方法的基础上,利用深度学习神经网络,提出了相应的处理解决方式,具体研究工作如下:(1)针对目标检测结果在姿态估计网络的应用效果不佳的问题,提出了一种基于对称空间变换的多人姿态估计方法。该方法利用空间变换的人体姿态估计网络,在网络的目标检测输出阶段添加空间变换模块,实现从不准确的人体候选框中提取高质量的单人姿态区域的目的,从而提高目标检测网络的性能,进而使单人姿态估计网络能够得到高质量的候选框,使得网络最终能够得到更好的人体关键点结果。利用上述方法,可以解决目标检测算法结果于姿态估计网络应用效果不佳的问题,同时,通过在MPII数据集和MS COCO数据集上的实验结果,验证了所提出的算法在提高候选区域框质量,提高网络整体性能的有效性和竞争力。(2)针对拥挤人群状态下人体检测困难的问题,提出了一种基于KM算法的多人姿态估计方法。该方法在目标检测和单人姿态估计网络输出结果后,通过优化损失函数,生成人体-关键点图,利用KM匹配算法,将关键点预测问题转化为求解人体-关键点图的最优匹配问题,最后通过进行算法匹配,解决拥挤人群状态下关键点错判、漏检等问题。最后通过实验验证,证明了上述方法可以提高拥挤人群状态下多人姿态估计网络的性能。(3)针对多人姿态估计网络模型复杂,运算时间长的问题,提出了一种基于MobileNet的轻量化多人姿态估计方法。该方法利用MobileNet网络轻量化的特点,在方法一的网络结构基础上,通过使用深度分离卷积和倒残差模型来降低网络的复杂度,从而在平衡算法准确率的同时提高算法的运行速度。最后通过对比实验验证了算法的有效性和竞争力。
其他文献
随着汽车起重机的不断发展,其在工程项目中的应用也越来越多。由于起重机在吊装时,需要人为的控制与决策吊装过程,所以会不可避免的出现操作失误或方案规划不合理等情况。针对以上问题,本文提出了多任务路径规划算法与吊装规划算法来辅助吊装人员进行吊装的作业。目前阶段汽车起重机在吊装时主要是人工操作,但在其他很多领域,已经开始使用深度强化学习来实现无人操作。作为大国重器,汽车起重机的吊装也正在向智能化方向发展,
糖尿病是一种严重损害人类健康的慢性疾病,可以使用便携式血糖仪监测血糖来诊治糖尿病。在便携式血糖仪芯片中,Flash控制器提供了CPU访问Flash存储器时所需要的时序控制电路。本文结合Flash存储器的特点,设计并实现了一款基于血糖检测SoC系统的Flash控制器。与传统Flash控制器相比,该Flash控制器实现了不同的程序下载方式,包括ICP下载模式、SWD下载模式以及SSP自编程模式,SWD
传统的卫星导航系统通常只能为用户提供导航服务,而卫星导航、通信一体化系统可以同时为用户提供导航定位服务和数据通信服务。相对于传统的导航系统而言,导航通信一体化的系统为用户提供的服务更加全面,卫星移动通信与导航功能相结合也成为当今一个热点的研究方向。到目前为止,几乎所有主流的卫星导航系统均在L频段部署了信号,L频段共存的信号较多,信号间的干扰问题日益严重,寻求新的频段来开展卫星导航业务非常重要。国际
频扫天线相较于相控阵天线,在满足扫描范围的条件下,节省了多个T/R组件,具有成本低、结构简单、容易实现小型化等优点;但频扫天线实现宽角度扫描时传输损耗也较大,两者相互矛盾。针对目前无人机“黑飞”对国家和社会安全带来严重威胁的问题,本文设计了一款用于“低慢小”目标监视雷达的宽角度频扫天线并生产加工出来用于实际工程,实现了对目标角度的测量。介绍了频扫阵列天线的基本理论和波导缝隙天线的辐射原理、多种辐射
推荐系统可以在海量数据中迅速发现用户喜欢的信息,已广泛应用于很多领域。传统的推荐系统根据预测评分的高低将推荐状态分为“推荐”或“不推荐”,这种二支的分类忽略了推荐过程中产生的成本问题;其次,传统的推荐系统没有充分挖掘和利用评分数据的价值,使推荐受到数据稀疏性的影响,难以学习用户的偏好;另外,在传统的推荐系统中,只关注项目与项目之间的相似性关联,即正关联,而忽略了项目与项目之间的负关联。形式概念分析
多目标优化问题广泛存在于工业制造、生产生活中,随着科技的发展和社会的进步,多目标优化问题呈现出大规模的特点。大规模多目标优化问题在车站的路径规划、供水系统规划等场景有重要的应用。尽管多目标优化算法的成果很丰硕,但是对于大规模多目标优化问题的研究还不成熟。大规模多目标优化问题的显著特点是决策变量空间的维度较大,影响了解的搜索效率。本文针对大规模多目标优化问题,主要研究以下几点:1.将高维决策变量空间
伴随着信息爆炸,推荐系统应运而生,其中核心的算法部分主要分为三块,分别是召回、排序和重排模块,在这里最为重要的是排序模块,在排序中关注最多的指标是点击率(Click Through Rate,CTR)和转化率(Conversion Rate,CVR),相对于CTR,CVR问题存在数据稀疏和样本选择偏差的问题,数据稀疏指的是训练时CVR数据规模上远远小于CTR数据,样本选择偏差指的是CVR的训练空间
基于实在法的视角,可以从规范的逻辑结构、识别步骤、适用情形和形成过程四个方面对一般法律原则和习惯国际法进行区分。从规范的逻辑结构来看,一般法律原则只能以原则的形式出现,具有程度较高的抽象特征;而习惯国际法通常以规则或原则的形式出现。从规范的识别步骤来看,识别一般法律原则首先需要满足"世界主要法律体系共有"的要求,其次符合"被移置于国际法体系适用"的条件;识别习惯国际法需要同时满足"国家实践"的物质
图像描述生成任务用一句通俗的话解释就是“看图说话”。人类快速地浏览一幅图像,就可以辨认并描述出图像中关于视觉场景的大量细节。然而,这种非凡的能力对计算机而言是一个极具挑战的任务。图像描述生成任务是一个典型的从视觉到文字的跨模态任务,其基础是图像内容理解和文本生成。具体来说,此任务首先对图像内容进行分析得到图像特征;然后基于已获得的图像特征生成相对应的文本描述。判断图像包含哪些内容并控制描述语句的生
纤维增强复合材料制品凭借其自身质量轻、强度大、耐腐蚀、可设计强等突出特点,使其在航天航空、船舶、军工、石油化工、汽车行业等领域获得广泛应用。纤维缠绕机是生产纤维增强复合材料制品的核心设备之一。纤维缠绕机按一定纤维缠绕规律将纤维增强复合材料缠绕在组合回转体表面上生产出纤维增强复合材料制品。因此纤维缠绕规律和按照纤维缠绕规律运动的纤维缠绕机运动轨迹成为纤维缠绕成型技术的关键。与之对应的针对纤维缠绕规律