论文部分内容阅读
近年来,由于互联网及数码设备的日益普及,视频的内容分析和处理受到各界的广泛关注。其中,基于视频的人体动作识别方法在近年来被广泛应用于各个领域,成为热门的研究方向。但是该领域在技术发展的过程中还存在着很多的挑战,比如人体动作的自由度较大、拍摄的背景环境差异、相机的移动和缩放、拍摄角度变化、视频中的噪声和遮挡等等,都会对识别的准确性造成影响。针对现有的视频人体动作识别方法存在的各种问题,本文对基于局部特征描述的视频人体动作识别方法进行了研究,通过提取视频的判别性区域及一种中层的视频表示方法来提高识别的准确率。首先,本文阐述了视频人体动作识别的方法,包括基于全局特征描述的视频表示方法和基于局部特征描述的视频表示方法,同时对基于局部特征描述的视频表示方法的流程和常用技术进行了详细说明,并分析了目前常用方法的优点和存在的不足。其次,本文提出了一种基于判别性超体素的人体动作识别方法。该方法通过一个预训练的过程,比较本类动作与其他类动作在这些视频区域上的不同,提取出对本类有判别作用的视频区域作为感兴趣区域,同时基于判别性超体素对视频进行描述。本方法针对人体动作识别领域面临的类内与类间差距的问题,能扩大类间差距,缩小类内差异。同时对复杂背景等干扰不敏感。此后,本文在多个常用的视频库上进行实验,并与近年来国际上的经典方法进行比较,实验结果表明本文的方法有较高的识别准确率。最后,本文提出了基于视觉注意的人体动作识别方法,进一步确定感兴趣区域。同时,为了解决视频中出现的缩放问题,本文还提出了通过视频的多层过分割来对视频进行表示的方法。实验结果表明,本方法能够达到更高的识别准确率,并且对视频的缩放不敏感。