论文部分内容阅读
人体运动视觉分析是近年来计算机视觉领域中备受关注的前沿方向,它从包含人的图像序列中检测、识别、跟踪人体并对其行为进行理解和描述,属于图像分析和理解的范畴。从技术角度而言,人体运动分析的研究内容相当丰富,主要涉及到模式识别、图像处理、计算机视觉、人工智能等学科知识;同时,动态场景中运动目标的快速分割、人体的非刚性运动、自遮挡和互遮挡等也为人体运动分析研究带来了一定挑战。人体运动分析在人机智能交互、安全监控、视频会议、医疗诊断及基于内容的图像存储与检索等方面具有广泛应用前景。运动分析过程一般包括四个阶段:目标检测,目标识别,目标跟踪,运动分析与理解。不同的应用场合,这四个阶段并不一定全都存在。一般情况下,目标检测和识别是必要的,文中重点研究运动目标识别。首先介绍研究背景和国内外现状、研究任务和目标。接下来,在运动目标检测阶段主要研究运动目标检测算法、运动目标的提取和目标模型的建立。运动目标检测的任务是将运动目标从序列图像中提取出来,它是后续处理的基础。首先,在分析现阶段较常用的三种运动目标提取算法(背景差分法,帧间差分法,光流法)基础上,考虑到本文的适用场合,采用背景差分法。然后,对检测结果作一次预处理:剔除检测得到的错误目标,并对运动目标作有关处理,包括去除噪声杂点,填充空洞等,有利于减小后续处理的计算量,提高后续处理时间效率。最后,建立用于识别的局部人体二维模型——头肩模型。在模型的建立过程中,针对文献[36]的不足提出了基于人体解剖学的改进算法。此算法能够建立较好的头肩模型,为特征提取及识别打下了良好的基础。在识别之前研究了人体模型特征。首先,介绍了几种具有旋转、平移、缩放不变性的特征类型;然后,针对本文应用环境,选择目标的部分形状轮廓的7个不变矩作为特征向量而提取出来。由于矩数值分布范围大,且有可能为负值,为了利于识别,文中对矩不变量进行先取绝对值再开方的压缩处理。在运动目标的识别阶段,目标识别即分类。本文的运动目标分为两类:人和非人。在介绍BP神经网络的原理、性能和学习规则基础上,针对BP神经网络分类器缺点探索从多方面予以改进,同时描述了几种基于数值优化的BP算法。通过对具有不同隐层单元数的神经网络的训练和测试,找到最佳的隐单元数;然后,对三种改进BP算法、动量及自适应学习率BP算法进行对比实验,分析其优劣。最后进行了实验验证。初步实验表明了本文算法的有效性。