论文部分内容阅读
三维手势以其方便、灵活的特性,在人机交互中具有重要的应用价值。三维手势的技术基础就是对手部姿态进行合理快速的建模。本文围绕交互场景下三维手部姿态建模技术进行研究,以手部姿态符合结构约束、算法实时性与复杂性兼得为目的,提出一种分层式手部姿态回归算法,并基于手部姿态设计了一套手势交互应用。本文的主要研究工作如下:针对交互场景下三维手部姿态估计建模技术进行研究,分析了交互场景下三维手势面临的问题难点,以手部姿态拓扑结构约束和算法效率与准确性兼得为目标,在级联式姿态回归算法和手掌骨骼结构的分析基础上,提出从手掌到手指的分层式手部姿态回归算法框架,相比传统方法大大简化了算法的运行复杂度的同时,保证了手部姿态合理的拓扑约束。针对三维手势中手部全局姿态估计问题,本文提出了基于手部深度数据的3D指尖法解决此问题。利用手部深度图像检测出3D指尖的位置,并分别计算出手指三维方向和手掌三维方向,从而实现快速的手部全局姿态的估计。最后与现有的点云PCA方法在公开数据库上进行了实验对比,其中手指三维方向的偏差角度与PCA法基本一致,手掌三维方向角度偏差比PCA法低33%,实现更准确的手部全局姿态估计。针对手指姿态估计问题,本文将手指姿态表述为关节点参数的形式,并基于3D Pose-Indexed特征和随机森林实现对手指姿态的初步回归,同时结合深度图像设计出投影特征,利用随机森林实现对手指姿态的校正过程。相比传统级联式姿态回归算法,保证了估计结果的拓扑结构约束的同时算法复杂度降低了1/3。在国际公开数据库MSRAH15中进行对比实验,以平均关节点误差为标准,本文方法比全局方向采用PCA方法的误差要低22%,在校正后下误差仍然能够降低3%。在ICVL数据库中进行实验,本文方法的平均关节点误差为17mm,相比其他方法虽然误差稍大了点,但是估计结果包含拓扑结构约束,且算法复杂度占优。最后以手部姿态为基础设计了一套交互应用,表明三维手势的巨大应用潜力。