论文部分内容阅读
随着科技的发展,第三代人机交互系统正在我们身边普及,而其中基于手势和姿势的交互方式使用起来更友好和方便,所以对手势和姿势进行图像识别的研究重要性变高。但交互系统中的图像识别技术仍存在一些难点,如计算量大、识别率不理想等,针对手势和姿势识别中的这些问题,本文在可见光、深度图等图像源上对图像识别展开研究,主要内容包括:1.在可见光的手势识别系统中,针对已有算法性能和速度不理想的情况,本文采集一定数量的正样本进行标定并加入负样本后,进行HOG特征提取后用AdaBoost算法将训练的多个弱分类器经过级联成为强分类器完成静态手势检测,在识别上用HOG特征加树形分类结构对几种常用手势进行识别。为了提高运行速度而使用经过加速能实时处理的算法和相应的优化。2.在背景复杂时基于可见光的识别算法性能会有所下降,如果采用深度图则效果更好,本文提出了在深度图上用三维形状上下文特征进行静态手势识别的算法,并提出手臂主轴校正和轮廓点中心采样等改进,前者可以解决手势旋转对特征的影响,后者可以提高手势识别率,而由于直接使用了三维空间的信息,使得对远近的尺度变化也有很好的适应性。实验结果表明在性能上优于已有主要算法,可以有效进行手势的识别,并完成人机交互操作。3.针对用深度图进行人体姿势估计算法中随机森林训练模块的资源消耗大、训练时间长等难题,本文提出在小规模的集群服务器上用消息传递接口技术对随机森林算法进行并行化加速,并结合算法特点进行优化降低存储消耗和占用带宽等,进一步提高训练速度。实验结果表明在小型集群服务器上不到一天时间完成一次训练,速度相比原来提升约30倍,经加速后可以及时进行多次训练从而完成对训练参数的调整和测试。4.针对人体姿势估计算法部分节点效果差的问题,本文提出降低训练开销并加入用多视角深度图的后处理技术改进。首先生成一个规模减小而包含常见典型动作的训练集合,并用小型集群服务器训练后进行骨架节点的估计,之后对置信度不高的骨架节点,在深度图投影得到侧视图和顶视图中再次计算需修正的骨架节点位置以提高节点的准确度。实验表明在使用样本少一个数量级的情况下能取得比已有算法平均误差更小的结果。