论文部分内容阅读
目前的动作捕捉技术主要建立在复杂的人体标记与传感器的基础上,成本较高,而基于深度学习的人体姿态估计正在成为新的选择。不过现有大部分方法是基于单人或图片的估计,对于视频多人的估计还有诸多挑战。为此提出了一种基于矫正网络的姿态估计与动作捕捉模型。首先,使用现有的多人二维姿态估计方法,以二维的输出作为三维估计模型的输入,三维估计以时域图卷积为主干网络。其次,设计三个校正单元,分别结合人体运动学的姿态矫正、人体力学的接触矫正和平衡矫正。实验效果表明实现了人体动作捕捉系统简易化设计。