论文部分内容阅读
视频中的行为识别作为智能监控系统的重要应用方面,目前已经成为计算机视觉领域中十分重要的研究方向。行为识别的过程可分为四个的部分:目标检测、目标跟踪、目标分类和目标行为识别。论文以模式识别和数字图像处理等理论为基础,经过对国内外人体行为识别的方法的分析和研究,提出了基于梯度方向直方图(Histograms of Oriented Gradients, HOG)、光流场方向直方图(Histograms of Optical Flow, HOF)的二维全局特征与运动特征相结合的行为识别方法,研究并实现了基于HOG3D三维局部空-时兴趣点特征描述的行为识别方法。基于HOG、HOF特征的行为识别方法首先利用帧差法和阈值法对运动区域进行检测,提取人体运动区域;其次对提取的运动区域用HOG和HOF特征进行描述,同时利用之前检测运动区域时得到的二值图像提取出人体二值图像的重心,通过对重心移动的判断,得到运动速度特征;再对所有测试数据的HOG或HOF特征应用K最邻近算法同样本数据进行对比,得到测试数据中每张图片所属的类别;最后将所有数据中的每张图片代表的类别识别并编为序号,将20个序号成为一组变成序列,应用隐形马尔科夫模型采用交叉检验的方法对所有数据进行测试。基于HOG3D特征的行为识别方法首先将视频帧分组并利用Harris-Corner3D检测算法检测出视频组序列中的3D兴趣点;其次对兴趣点进行筛选剔除不满足条件的点,对剩下的兴趣点用HOG3D特征进行描述;接着运用K均值聚类算法对所有兴趣点进行聚类,得到的聚类中心就是词袋模型中的词典库;最后对每个视频序列中的兴趣点按照直方图的形式统计其在词典库中的位置,最终得到视频序列的直方图特征,对所有的直方图特征应用支持向量机模型并采用交叉检验的方法进行测试。本文选取了KTH数据中在四个场景下25个人不同的6个动作作为实验数据集,对论文中研究的人体行为识别算法进行了仿真,通过对结果分析,证明了本论文中实现的算法的有效性。