论文部分内容阅读
基于视频的人体运动识别是计算机视觉研究中的—项基本课题。这一课题近年来成为人们越来越感兴趣的一个研究方向,一方面是因为视频中的人体运动在海量视频数据检索、人机交互、视频监控、体育运动分析等领域有着广泛的应用前景,而且基于视频的方法是唯一一种无入侵式的运动捕获方法。另一个方面在于基于视频的人体运动识别包含大量的挑战性难题,例如:从图像中估计自遮挡非刚体的3维姿态和运动,视点变化的影响、镜头运动的干扰等等。从理论研究的意义上看,问题的复杂性使得研究具有更大的挑战性。基于视频的人体运动识别作为计算机视觉一个重要分支,是研究如何从指定视频序列中识别出特定的人体运动。目前已有大量关于人体运动识别的研究成果,这些成果大部分局限于研究平缓的人体日常运动,如行走、小跑、坐下等。但是在体育视频中,人体运动有其特殊性,如人体姿态可呈倒立状态,运动速度快,运动过程中视点变化。本文研究如何表示与识别体育视频中的人体运动。我们在总结和分析国内外相关研究工作的基础上,针对体育视频中人体运动特点,主要对视频序列中的人体目标检测、人体目标分割、人体目标跟踪及人体运动的表示与识别等方面进行了研究。与以前的工作相比,本文的贡献主要体现在以下几个方面:1.提出了一种无姿态约束的上半身人体目标检测算法。现有的人体目标检测算法只能检测出呈基本直立姿态的人体目标。为了检测出体育视频中的姿态变化多样的人体目标,我们提出了一种无姿态约束的人体目标检测算法。算法首先通过形状上下文匹配查找人体候选目标,然后通过方向梯度直方图特征结合支持向量机来去除假阳目标。该算法不但能够检测出各种姿态的人体目标,而且与方向梯度直方图检测算法相比,检测速度有很大的提升。2.提出了一种无交互的人体目标分割算法。图割算法是一种交互式的目标分割算法,通过输入目标的范围实现目标分割,但是分割效果不理想。通过分析图割算法中将前景目标误分割为背景的原因,我们修正了图割算法,再结合人体目标检测算法,提出了一种自动的人体目标分割算法。相比原图割算法,该算法无需交互输入就能够实现人体目标的自动分割,并且得到了更好的分割结果。3.提出了一种快速运动目标的跟踪算法。Mean Shift跟踪是一种常用的实时跟踪算法,但是无法有效跟踪快速运动的目标。针对体育视频中的运动目标运动速度快的特点,我们提出了一种快速运动目标的跟踪算法,实现了对视频中的快速运动目标的跟踪,且在目标背景复杂的场景中也能有效跟踪目标。4.提出了一种复杂人体运动的表示与识别方法。通过人体目标检测、分割、跟踪算法,从视频中提取人体前景,再采用人体前景图像的方向梯度直方图特征来表示人体姿态,提出了一种基于人体姿态自相似矩阵的人体运动表示方法。该方法具有视点不变性、背景无关性、运动实施者无关性等优点,此外,摄像机的运动对我们的人体运动表示方法影响较小,使得我们的方法更适合对实际场景下的人体运动进行表示与识别。综上所述,本文提出了人体目标检测算法、快速运动目标的跟踪算法和人体目标分割算法,利用这些算法从视频中提取运动人体目标的前景图像,并利用前景图像的方向梯度直方图为底层特征,建立人体姿态自相似矩阵来表示与识别人体运动。采用人体姿态自相似矩阵表示人体运动,除了具有视点稳定性外,还可以消除摄像机运动的影响。