论文部分内容阅读
人体行为识别是机器学习中目前最重要的研究方向之一,不管在学术研究还是实际应用中都取得了迅猛的发展。目前,人体行为识别与视频分类技术在众多的智能产业都有着广泛的应用,并有着广阔的市场空间和使用前途。不过先进的技术往往和大量的数据相伴相生,对来自现实生活中的大量视频进行高效的分析和处理是研究视频分析技术的目标,而先进方法的研究对行为识别的推广有着至关重要的作用,虽然在前人孜孜不倦的努力下,取得一定进展,但仍面临许多挑战,行为的特征表示是行为识别方法研究的基础,因此,本文以探索更加有效的特征作为出发点,进行了以下研究:首先,本文对国内外的人体行为识别研究中最新的比较流行的特征构建方法进行了总结,并针对现有特征仍然存在的缺陷进行了分析,针对传统的稠密轨迹数目众多,存在冗余的情况,本文通过计算轨迹的离散系数仅将较为重要的轨迹筛选出来用于特征构建,此外,受物理学中速度和加速度的关系对运动定义之重要性的启发,我们将速度和加速度进行了共现统计构建了速度加速度共现描述子,挖掘了运动趋势信息,更加准确地描述了轨迹的运动。其次,考虑到仅将轨迹作为独立的个体,忽略了轨迹的近邻信息,因此,我们通过KNN算法获取近邻轨迹,为了能够计算轨迹周围丰富的近邻信息,本文从四个不同的角度包括绝对运动、相对运动、距离关系和方向关系计算中心轨迹和近邻轨迹之间复杂的关系,然后,我们利用统计学中描述数据分布特征的九个典型测度包括均值、中位数、最大值、最小值、极差、方差、离散系数、偏度和峰度对轨迹间的近邻分布信息进行描述构建了轨迹间的时空近邻分布描述子,本文从四个不同的角度出发,彼此之间能够相互补充,提高了特征对复杂多变的行为的描述能力。再次,针对现有编码方法在编码过程中,忽略了同一类别不同聚类簇界限模糊以及不同类别聚类簇相似性较大的问题,使得编码过程中引入混淆,为了解决这一问题,本文提出了大间隔最近邻居编码方法,通过学习新的距离度量,使得在转换空间中容易混淆的样本尽可能的分离,同时利用算法本身的优势,提高了投影的准确性,从而减少了在编码过程中引入的混淆,优化了编码结果,并进一步将本文提出的轨迹间的时空近邻分布描述子四个角度的信息通过本文提出的编码方法学习不同的转换矩阵进行编码并结合后用于行为识别,进一步优化了识别结果。最后,总结本论文主要的研究内容,并给出未来的研究方向。