论文部分内容阅读
人体行为识别作为计算机视觉学科中一个非常重要的领域,越来越多的研究机构、高等院校以及相关企业都投身到该领域的研究中,对于视频中的人体行为视频有许多实际应用,例如:视频监控、人机交互、视频检索等等,由此可见,对视频中的人体行为识别分析研究在现在和未来都是具有极高的学术研究价值和商业应用价值的。视频中的人体行为识别一直是计算机视觉学科中的一个难点,目前现有的人体行为识别依旧停留在针对简单场景下单个运动目标的简单行为识别,而对视频中复杂的现实场景下的复杂行为的识别正确率较低,没有达到可使用的识别精确度。通常而言,人体行为识别大体可以分为提取视频描述特征、训练视频描述特征和对视频描述特征进行分类这三个步骤。本文参考了大量的国外发表的相关的技术论文和会议,对国内外相关领域的发展现状进行了分析和总结,针对目前各种特征提取算法的优缺点和该研究领域的局限性,提出了一种新的特征,该特征首先通过把多阈值像素转移比率图(Multi-threshold Pixel Switching Ration Map, MTPSRM)、边缘方向直方图(Edge Orientation Histograms, EOH)和运动方向直方图(Motion Orientation Histograms, MOH)作为全局特征,与局域Cuboid特征进行融合,构造了一个既包含了行为的全局特征又包含行为局域特征的新的特征,提高了用单一特征进行识别的识别正确率;然后对提取到的视频描述特征通过在线字典学习(Online Dictionary Learning)、局域线性编码(Locality-constrained Linear Coding, LLC)等机器学习方法后得到最终的视频特征代表;最后用本文提出的将稀疏线性分类器(Sparse linear classification)与支持向量机(support vector machine, SVM)以打分的机制相结合的分类器进行分类识别得到最终的识别结果。本文在MATLAB平台上实现了算法,用Weizmann视频数据库、KTH视频数据库、UT-Tower视频数据库、YouTube视频数据库、网络视频数据库和自己录制的行为视频库做了大量的实验验证了本文所提出的人体行为识别系统的识别正确率,并且与目前一些发表了的相关领域的文章的实验结果进行了对比,通过实验结果,可以看出本文提出的人体行为识别算法提高了识别正确率。