论文部分内容阅读
序列图像的运动分析是诸多学术领域,如计算机视觉、人工智能、模式识别等广泛关注的一个课题,指从静态序列图像中获得关于运动物体以及运动本身的特征,包括运动目标是否存在,运动物体的识别以及运动目标的跟踪等。这些研究成果具有广泛的应用前景,如虚拟现实,智能监控,人机交互等。一个完整的运动分析过程包含四个阶段:运动检测,运动目标识别,运动目标跟踪,运动目标动作分析与理解。这四个阶段并不是一定要全部存在,而是取决于应用的场合。一般情况下运动检测和运动目标跟踪是必要的,本文研究重点集中在这两个阶段,同时也对运动目标识别作了初步的探索。运动目标检测是将运动物体从序列图像中提取出来的过程。这一阶段是后续处理的基础,具有重要意义。然而由于现实世界的复杂性比如光照的变化,影子以及干扰物等的存在,使得这一阶段的处理并不简单。目前几乎所有的运动目标检测算法都是建立在一定程度的限制和假设的基础上,很难找到一个适用于所有应用场合的算法。本文分析了现阶段比较常见的三种运动提取算法(背景差分法,帧间差分法,光流法),综合它们的优缺点以及本文所适用的场合,采用背景差分法进行运动目标的提取,通过分块恢复背景法来形成动态的背景模型,并进行及时更新,使经过更新后的背景模型能够及时反映背景的动态变化。本文在运动目标识别阶段,先对运动检测结果进行一次预处理:将运动检测阶段错误检测到的目标剔除掉,同时对运动目标进行相应的处理,包括去除杂点,填充空洞等。这样做有利于减小后续处理的计算量,也提高了后续处理的效率。目标识别也就是目标分类,本文的运动目标分为两类:人和非人。分类判别原则:如果运动目标完全进入视角,用人体宽高比来初步检测那些可能是人体的运动目标,对于不满足人体物理宽高比的运动目标,利用人体模型对运动目标进行匹配,或把运动目标骨骼化进行匹配,当满足一定的匹配度时,认为当前运动目标为人;如果运动目标没有完全进入视角,先进行人脸检测,如果监测到人脸,当前的运动目标必定是人,否则,用部分人体模型进行匹配,当满足一定匹配度时,认为当前的运动目标是人。当检测到运动目标是人时,进行运动目标跟踪。在这个阶段,本文利用非参数化的跟踪算法CamShift算法。CamShift算法根据运动目标的色彩信息对运动目标进行实时跟踪,具有鲁棒性和实时性的优点。但是当运动目标速度较快或在场景中滞留时,容易发生跟踪丢失。本文提出将CamShift算法和运动目标检测相结合的方法跟踪运动物体,该方法不但可以跟踪单个运动目标,还可以在跟踪多个运动目标。最后,分析了本文算法的有效性,能够检测、识别和跟踪运动目标,并具有一定的鲁棒性。