论文部分内容阅读
随着计算机中央处理器的运算能力、硬盘储存容量的不断提高和视频采集设备的多样化发展,视频数据也被人们广泛的应用在生活中,人们通过网络来分享各种有趣的视频,使得网络上的视频数据量急剧的增加。而在一些人流量较大的场所,如医院、银行、机场和火车站,视频监控是一种很重要的监控和震慑犯罪的手段,但是这些摄像头和相关的储存设备仅仅能采集和储存视频数据,而视频中人的各种动作及其行为目的仍需要人工判读,因为它们还不具备机器自动识别的能力。在视频中应用人体动作识别技术可以有效减轻工作人员的工作强度,提高工作效率。由于人体结构的复杂性,能做出来的动作更是数不胜数,所以对视频中人的动作进行识别一直面临着许多的问题和困难。在这种情况下,人们已经提出了众多的人体动作自动识别方法,其中基于特征和区域的识别方法也得到了深入的研究和发展,但是由于视频是在一段时间内的各种动作的集合,所以对它的自动识别仍然受到了各种各样的限制,随着时空特征被提出,一些基于时空特征的整体动态系统对人体动作识别也被相应的提出,时空特征可以很好的在时间和空间的基础上描述人体动作,也成为人体动作识别的热点话题,但是时空特征也有信息量偏大的问题。此外,人体能表现的动作类别太多,所以把所有的动作进行分类和统计几乎是不可能的事情。针对常见传统方法中识别速度慢,准确率低的问题,本文提出了利用对比姿势中的某几个关键动作来识别视频中的人体动作,该方法可以在一定程度上提高速度和准确率。本文对视频中人体动作的识别分为三个步骤。第一步是提取关键姿势样本并计算样本的Hu矩。也就是通过分析人体动作的视频帧序列,按照不同帧中动作的自相似性和周期性等运动特征,人工挑选出合适的关键性动作作为样本动作,然后计算这些关键动作的Hu矩,并把它们保存起来。第二步是识别待测视频中的动作。对待测的视频,提取出运动目标,计算它的不变矩,并与关键姿势样本的不变矩比较,然后采用带拒绝的K近邻算法来对待测样本进行分类,第三步是将不在已有分类的样本中的类别标识为未识别动作,并把这些未识别的动作收集到一个特定的集合中。同时也根据动作的的含义把这些未识别的动作,进行建模、提取关键动作,构建新的动作类别。实验结果表明,人体动作中有些特征明显的动作,这些特征能有效的描述动作和区分不同的动作,合适的关键动作的选取可以有效的提高识别的正确率,通过识别数据分类中不存在的动作,对这些动作进行收集和标识,这样也能提高系统对已有分类识别的范围。