【摘 要】
:
人体姿态估计是计算机视觉领域比较热门且具有一定挑战的研究方向,是人体姿态追踪、动作识别、行为理解等高级应用的研究基础,可广泛应用于医疗姿态矫正、娱乐人机交互、安防行为检测等实际场景中。人体姿态估计的算法优劣决定了后续拓展应用的性能好坏,因此探索并实现精确、高效、快速的人体姿态估计算法具有重要的研究价值与实用意义。尽管深度学习技术推动了人体姿态估计的研究进展,但在实际落地应用中,仍然存在一些有待解决
论文部分内容阅读
人体姿态估计是计算机视觉领域比较热门且具有一定挑战的研究方向,是人体姿态追踪、动作识别、行为理解等高级应用的研究基础,可广泛应用于医疗姿态矫正、娱乐人机交互、安防行为检测等实际场景中。人体姿态估计的算法优劣决定了后续拓展应用的性能好坏,因此探索并实现精确、高效、快速的人体姿态估计算法具有重要的研究价值与实用意义。尽管深度学习技术推动了人体姿态估计的研究进展,但在实际落地应用中,仍然存在一些有待解决的难题。一方面,由于近大远小的视觉原理,人体尺度多变导致不同大小关键点检测难度的失衡,提取小目标人体的关键点特征尤为困难;另一方面,遮挡问题在实际应用中普遍存在,但现有网络和算法在多人遮挡场景下的鲁棒性不高,缺乏针对性的解决方案。针对以上不足,本文从提升人体关键点网络检测精度、优化多人关键点分组匹配算法这两个角度展开研究,主要工作及创新点如下:(1)针对多尺度难题,本文基于注意力机制改进了现有的高分辨率网络。首先,为了充分挖掘小目标关键点的特征,设计了特征强化学习模型,并嵌入到基准网络中以提高高分辨率分支的表征学习能力;其次,针对现有高分辨率网络多尺度融合策略的不足,设计了注意力选择模型,通过自适应地调节不同尺度热图的融合权重,强化了多尺度特征信息的互补与交流。(2)针对挑战性较大的遮挡难题,本文基于人体骨骼特征的先验信息提出了多层级关联嵌入算法。首先,为了解决两人肢体遮挡带来的分组干扰问题,该算法通过显式模型约束,辅助网络更合理地挖掘出相邻关键点之间的隐式肢体联系,细化不同关键点的配对策略和肢体连接方案;其次,针对被遮挡关键点检测失败的问题,该算法联合可见关键点的特征和可见肢体的上下文信息,反向推理被遮挡关键点的空间位置。(3)本文联合注意力高分辨率网络和多层级关联嵌入算法构建了一套端到端的多人姿态估计方案,整体方案采用多分辨率监督策略训练网络检测关键点,借助多层级关联嵌入算法指导网络推理多人姿态。在MS COCO Keypoints Challenge和Crowd Pose数据集上,训练了整体模型并验证其性能,依据官方规定的评估指标,在MS COCO Keypoints Challenge数据集上,相较于基准网络,本文改进网络的平均、中小尺度和大尺度人群检测精度分别提升了0.8%、1.3%、1.0%;在Crowd Pose数据集上,本文改进算法在稀疏、拥挤、密集三种场景下的检测精度分别提升了2.2%、0.6%、1.5%,整体方案具备精度更高、鲁棒性更强、泛化性更好的优势。此外,相较于自顶向下方案,本文模型所采用的自底向上方案在检测速度上具有更大优势,具备了良好的快速测试和应用部署能力,可推广至移动端实时人体姿态估计的应用。
其他文献
为规范眩晕症的科学用药,中国医药教育协会眩晕专业委员会特成立专家小组,在纳入现有医学科学证据的基础上,结合专家丰富的临床经验,经反复讨论后形成《甲磺酸倍他司汀治疗眩晕症的专家共识》。本共识包括组胺类药物的药理基础以及甲磺酸倍他司汀在常见眩晕疾病(如良性阵发性位置性眩晕、梅尼埃病、前庭神经炎等)中的用药推荐等级、剂量、疗程、复查方法、特殊人群用药、药物不良反应等方面,旨在帮助医生提升临床实践水平。
图像视频中的物体分割技术是众多计算机视觉应用的基础。为降低物体分割技术落地应用的数据标注成本,研究弱监督物体分割技术非常必要。传统弱监督分割技术往往只关心图像中物体和背景的外观特征,而忽略了图像中丰富的三维几何信息。为此,本文展开了基于图像深度估计的弱监督物体分割技术研究和应用。首先,针对当前深度估计模型主要聚焦于室内或无人驾驶场景,缺乏通用的开放场景下的深度估计数据集和模型,本文收集了开放场景单
病理图像中细胞的数量与位置分布反应了疾病的重要信息,有助于病理学分析与疾病诊断。细胞计数、定位与分析通常由具有专业知识的医生完成,人力成本高,消耗时间长,不便于疾病的快速诊断与对症治疗。随着图像处理技术的快速发展,细胞自动计数与定位技术取得了长足的进步。传统的基于区域检测和细胞分割的定位方法及密度回归细胞计数算法,对于形态结构相对简单的病理细胞图像,性能较好。但病理细胞往往呈现形状变化(非圆形)、
近年来,无人机、移动机器人、增强现实等人工智能技术发展迅速,成为当前热门的研究方向。其中的一项核心技术就是视觉里程计(Visual Odometry,VO)技术。视觉里程计使机器人能够通过轻量级的相机感知周围的环境,并确定自身位置信息,这对于机器人的智能化控制是必不可少的。仅使用单个相机的视觉里程计称为单目视觉里程计,因其成本低、容易部署等特性,成为了机器人领域的一项重要研究课题。单目视觉里程计可
图像语义分割是计算机视觉的基础任务之一,旨在为图像的每个像素分配语义标签,是自动驾驶、视频美颜、医学影像分析、遥感影像分析等人工智能应用中的关键技术。为促进图像语义分割技术的快速、低成本落地应用,进一步提升语义分割网络的推理速度,减少其训练过程中所需要的人工标注量,本文基于神经网络架构搜索(Neural Architecture Search,简称NAS)研究了轻量级、弱监督语义分割网络的设计,从
脑血管疾病是影响国民健康的重要原因之一,严重时可导致卒中等意外。由于脑卒中具有发病急的特点和较高的致死致残率,在急诊中如何提高脑血管疾病的诊断准确率、缩短诊断时间是临床上需要解决的一大问题。急诊中首选的成像方式是快速清晰且无创的计算机断层血管造影(Computed Tomography Angiography,CTA)。但CTA是三维影像,诊断时需来回查看其二维切片,这大大降低了医生的诊断效率。高
2019年12月由于新冠疫情爆发,全球200多个国家人民都在面临病毒的威胁。在这种情况下,及时快速的诊断可以较早的发现受感染的患者,阻止感染患者疫情的扩散。一方面,早期的临床医学研究表明,COVID-19患者在CT扫描的影响序列中表现出某些独特的放射学特征可以作为肺部感染的评定与估计严重程度。但是由于放射学影响特征需要放射科医生的大量诊断经验,导致医生在诊断COVID-19和其他病毒性肺炎上有显著
建立了液相色谱-串联质谱法测定新型亲环蛋白D抑制剂RN-0001在SD大鼠全血中的浓度。样品前处理采用简单的蛋白沉淀法,色谱分离在Gemini?C18 110?,色谱柱(50 mm×2 mm,5μm)上进行,以含10 mmol/L乙酸铵和0.1%甲酸的水溶液作为流动相A,含0.1%甲酸的甲醇溶液作为流动相B,在0.8 mL/min流速下梯度洗脱。待测物RN-0001和内标环孢菌素A的检测采用正离子
在室内建筑设计信息化技术领域,计算机辅助技术极大地提升了人工设计效率和设计方案的视觉呈现效果,已经实现了单纯人工设计到信息化辅助设计的转变,但依然存在使用专业性要求高、设计工序冗长等缺点。近年来,随着人工智能技术的蓬勃发展,产生了大量的图像智能技术,这为室内设计智能化发展提供了新的契机。通过对室内建筑设计的关键模块实现智能化设计,可在无人工干预的情况下,利用人工智能技术满足人们对于美学设计的个性化
<正>胰岛素是人类糖尿病治疗历史上具有里程碑意义的发现,解决了糖尿病患者高血糖不能控制的问题[1],在此基础上奠定了强化血糖控制可以延缓糖尿病慢性并发症发生的循证医学依据,并由此诞生了两大重量级研究成果,即糖尿病控制与合并症试验(Diabetes Control and Complications Trial,DCCT)和英国糖尿病前瞻性研究(United Kingdom Prospective