论文部分内容阅读
体能训练作为军人提升身体素质的重要方式,是构成部队战斗力的基本保障。为了帮助部队更好地掌握士兵训练情况,需要采用科学有效的方式评估训练成绩。目前士兵体能训练成绩的评定类型多采用人工方式进行,存在效率低、人力物力资源消耗大、评定结果受主观因素影响等问题。本文针对部队官兵所需考核的通用体能训练课目,将深度学习技术应用于士兵体能训练成绩评定过程。系统通过摄像头采集士兵体能训练视频,针对引体向上、俯卧撑和仰卧起坐课目,应用姿态估计算法获取士兵二维人体关键点坐标,抽取动作视频关键帧进行评估。针对跑步类课目采用多目标跟踪算法区分不同士兵目标,对士兵跑步过程进行追踪,获取士兵跑步成绩。基于上述研究设计了基于深度学习的士兵通用体能训练评估系统。主要研究内容如下:(1)针对Trans Pose网络具有参数量大、计算量大、训练复杂以及处理视频序列缺乏帧间联系的问题,提出了一种Lite-Trans Pose网络模型。Lite-Trans Pose使用轻量化网络模块重构卷积主干网络部分以缩减网络规模,同时保持高分辨率特征图处理结构保证模型准确度。采用一种前置层归一化结构,减弱Lite-Trans Pose编码器部分在warm-up阶段的超参数敏感性,更利于网络梯度反向传播,加速模型收敛。同时在编码器结构部分引入多头注意力机制,使网络关注不同子空间信息,捕捉更丰富的特征。最后根据光流传播算法连接视频帧间信息,提升Lite-Trans Pose视频流数据处理能力。通过实验证明,Lite-Trans Pose相较Trans Pose网络,在COCO数据集、MPII数据集上的准确率略有提升,并且计算量由21.8G降低为15G,参数量由17.5M降为4.85M,训练所需资源减少75%,模型整体取得了良好的轻量化效果。(2)针对DAN网络存在跟踪准确率较低、碎片化跟踪次数较多等问题,提出了一种结合反瓶颈结构与混合注意力机制的ATT-DAN网络模型。ATT-DAN网络采用预训练的VGG16作为特征提取主干网络,特征降维过程中增加反瓶颈结构与通道注意力机制,反瓶颈层结构可以减少特征信息流失,通道注意力机制帮助网络自适应地学习潜在的关键信息,获得更精准的跟踪目标外观特征。在压缩网络引入残差链接结构,增加特征信息利用率,同时引入空间注意力机制减少背景因素干扰,优化图像中士兵目标位置的权重,提升网络准确率。通过在MOT17数据集上实验,相较于DAN网络,ATT-DAN网络的跟踪准确度提升8.0%,跟踪目标ID切换次数减少81.6%,碎片化跟踪次数减少77.4%。ATT-DAN网络取得更出色的追踪效果。(3)基于上述网络设计了士兵通用体能训练评估系统。通过Lite-Trans Pose网络提取士兵在引体向上等体能训练课目时的人体关键点信息,与参数化规范性训练动作表示进行对比,判断士兵动作标准程度是否处于合理范围,判断当前动作是否规范并进行计分。通过ATT-DAN网络跟踪士兵在跑步类项目中目标在运动场中位置信息,记录士兵跑步轨迹,根据士兵边界框与跑道线相交检测结果判断是否已冲线,并对士兵跑步成绩进行记录。在模拟士兵训练场景下实验,本文提出的士兵通用体能训练评估系统具有良好的实用性。