论文部分内容阅读
人体行为识别是计算机视觉领域的研究热点和难点,在智能监控、高级人机交互、体育运动分析和基于语义的视频检索等方面有着重要的意义和广阔的应用前景。计算机理解人体动作和行为将成为未来高层计算机视觉技术发展的重要方向。目前,人体行为识别的研究尚处于初级阶段,尽管在单一背景的简单动作识别上取得了一定的进展,但是由于人体行为的复杂性、场景的多样性等问题,真实场景下的行为识别仍然面临着许多困难。针对上述情况,本文围绕基于视频的人体行为识别展开研究,进行了以下三个方面的工作:
1.归纳总结现有方法。查阅大量文献,对国内外计算机视觉领域的人体行为识别方法进行全面的归纳和总结,详细介绍了常用方法的基本思想和原理,并分析比较了各方法的优缺点。
2.提出了一种基于熵的特征筛选方法。针对局部时空特征提取存在噪声和干扰等问题,本文通过计算特征点之间的熵,对检测到的局部动作特征进行筛选,剔除不良码本项,同时结合局部特征描述算子大多使用直方图进行特征表示的特性,使用改进的直方图相交核作为特征相似度的衡量方法。在KTH数据集上的实验结果表明该方法增强了特征码本的判别能力,提高了识别效果。
3.提出了基于条件随机场的连续行为切分识别模型。针对复杂行为切分困难和识别率不佳的问题,本文借鉴中文词性标注中分词与标注同时进行的方式,将条件随机场模型与支持向量机相结合,建立连续行为的切分识别模型。通过对输入的图像序列进行基于光流的关键帧检测,将图像序列切分为动作基元片段,并对其进行局部特征检测和描述,构建运动特征码本。并结合支持向量机对动作基元的码本向量进行分类,从而使用条件随机场模型对得到的动作基元类别序列进行切分和识别,实现了模拟真实场景中,在不同的背景、尺度、视角和光照等条件下的连续行为的切分和识别。
总之,本文在总结现有人体行为识别方法的基础上,进行了简单行为识别和连续行为切分与识别等方面的研究工作,提出了基于熵和直方图相交核的动作特征筛选方法和基于条件随机场的连续行为切分识别模型,实验结果验证了本文所提出方法及模型的有效性。