基于视觉词包模型的行为识别

来源 :中国科学院研究生院中国科学院大学 | 被引量 : 0次 | 上传用户：hongjiansu1

【摘要】

：

人体行为识别(HAR)是计算机视觉领域中备受关注的前沿方向和最为活跃的研究主题之一，它是指利用计算机视觉技术从图像或视频序列中识别和理解人的个体行为、人与人之间以及人

【作者】

：

原春锋

【机构】

：

中国科学院大学

【出处】

：

中国科学院研究生院中国科学院大学

【发表日期】

：

2010年期

【关键词】

：

时空区域描述子稀疏时空金字塔匹配核时空邻近分布特征融合视觉词包行为识别

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

人体行为识别(HAR)是计算机视觉领域中备受关注的前沿方向和最为活跃的研究主题之一，它是指利用计算机视觉技术从图像或视频序列中识别和理解人的个体行为、人与人之间以及人与外界环境之间的交互行为。在运动目标的视觉分析中，人体行为识别(HAR)占有极其重要的地位，属于视觉中的高级处理部分，是运动分析的最终目标。人体行为识别(HAR)除了具有重要的理论研究价值以外，还在智能监控、运动分析、人机交互、虚拟现实等方面有着巨大的应用前景和潜在的经济价值，研究人体的行为模式将为人们的生活带来全新的交互方式。　　近年来，行为识别处于飞速发展阶段，其中基于局部特征的视觉单词的词包(BOVW)方法日益成为主流方法之一.基于BOVW的识别方法避免了传统行为识别方法依赖于前景分割、目标检测、目标跟踪等技术的缺陷；并且与基于全局特征的方法相比，该类方法对于噪声、遮挡、行为类内变化等更具鲁棒性。本文以视频中人体行为识别作为研究课题，对基于视觉词包识别系统中的重点和难点包括特征提取、运动表征、行为识别等方面展开了深入研究。论文的主要工作和贡献如下：　　 ①提出了一种新的局部时空特征-基于协方差对数欧氏黎曼度量的时空区域描述子。其统计了底层特征的协方差矩阵来表示在视频序列中检测出来的感兴趣区域，然后由于协方差矩阵不在欧氏空间内，我们提出引入对数欧氏黎曼度量来计算两个协方差矩阵之间的距离.这种描述子可以同时融合多种底层特征例如光流、梯度等，而以往的描述子大多只统计了一种底层特征。另一方面，我们采用推土机距离(EMD)对视频序列对进行匹配，与广泛应用的欧氏距离相比，EMD对于度量大小不同的直方图间的匹配具有更好的性能。　　 ②提出了一种金字塔词汇树来构建词汇表.对于视觉单词的词包(BOVW)模型，词汇表的大小对识别结果有很大的影响。一般地，大的词汇表对类间的行为更有区分力，而较小的词汇表对类内行为的变化具有更好的容忍性且对噪音更鲁棒。我们提出一个金字塔状的词汇树来对局部时空特征进行建模，与传统单一词汇表相比，词汇树同时兼具大词汇表和小词汇表的优点，既能区分类间的差异又能容忍类内的变化。另外，我们结合局部特征的时空信息，提出了一种稀疏的时空金字塔匹配核(SST-PMK)来度量视频序列间的相似度。实验证明提出的SST-PMK均优于SVM分类器中其它常用的核函数。　　 ④提出了一种时空邻近分布矩阵来捕获局部时空特征的空间几何分布情况，并且其同时也刻画了行为类的表观特征。该时空邻近分布矩阵克服了BOVW方法一个最主要的缺点，即几何无约束性所导致其无法区分那些具有相同的时空特征但特征的空间分布不同的不同类行为。进一步，一个与之相应的时空邻近分布核被设计以度量视频对间的相似度。我们提出的基于时空邻近分布的行为识别算法在KTH数据库取得了目前最好的识别准确率。　　 ④提出了一种新的融合策略-通过基于上下文信息的融合机制将行为的两种互补表征融合在一起进行行为识别。一方面，我们采用了基于时空兴趣点的表观信息的行为建模，和基于时空兴趣点的位置信息的行为建模两种互补的行为表征方法。另一方面，我们提出了一种新的融合方式：基于上下文的行为融合方法。通过在一种特征空间中学习出每个视频序列的上下文，对每个视频建立起一个子图，整个库构成一个超图。然后在另一种特征空间将两个视频之间的比较扩展为视频及其上下文之间的比较，克服了以前的基于两两之间(pairwise)相似度度量方法对噪音的敏感性。

其他文献

区域定位系统弹载接收器设计

现代战争中，迫切需要实现近程火炮系统的精确制导，以提高火炮系统的命中精度。区域定位系统不仅可以给火炮系统提供精确的定位信息，还可以实现炮弹的全自动制导。本文基于某区域

学位

近程火炮弹载接收器信号跟踪微处理器

图像光照处理算法与仿人乒乓球机器人视觉系统研究

仿人机器人视觉系统是计算机视觉理论在智能机器人技术领域的一个重要应用,是“人形”机器人实现自主行为能力的重要环境感知技术之一。与国外的仿人机器人技术研究水平相比,

学位

仿人机器人机器人视觉图像光照处理阴影检测运动轨迹预测动态定位

五自由度搬运机器人的运动控制与精度标定方法研究

目前在冲压生产行业中，采用搬运机器人代替人工操作的自动化生产方式是提升产品质量、保障安全生产、提高生产效率、降低生产成本的技术解决途径，也是该行业制造模式发展的主要

学位

搬运机器人运动学分析控制系统精度标定方法

基于偏差分离的一类非线性系统的控制方法研究

非线性和不确定性在实际系统中普遍存在，使实际系统难以建立精确的数学模型，从而对控制系统的性能产生不利影响。不确定非线性系统的控制问题已经成为控制理论研究的热点问题。

学位

非线性控制不确定性偏差分离输出反馈区域极点配置滑模变结构控制无人直升机

基于李群理论的图像跟踪与识别

图像跟踪与识别是无人飞行器光电探测与制导的关键核心技术,动态几何形变是图像跟踪与识别技术面临的突出难题之一。基于欧氏空间的图像跟踪与识别理论,采用线性或线性逼近的

学位

图像跟踪识别算法李群理论几何优化流形统计无人飞行器

数字图像复原相关问题研究

随着计算机技术的迅速发展,由于直观、形象、易懂和信息量大等特点,使得数字图像作为现代信息传递中的一个重要媒介,得到了极为广泛的应用。但实际图像获取系统的不完善所引

学位

数字图像复原视频信号去隔行处理图像超分辨率

车载卫星天线数字随动系统设计

随着社会的进步和信息化技术的提高，卫星通信事业得到了快速的发展，车载卫星通信由于其机动、灵活的特点，已经在许多领域得到广泛的应用。　　通常使用卫星天线接收卫星信号，必

学位

数字信号处理器步进跟踪车载卫星天线随动系统

面向影像组学的图像配准及恶性肿瘤分类算法研究

恶性肿瘤的早期诊断及其治疗效果评估，对于辅助医生制定有效治疗方案，提高患者生存时间以及生存质量具有重要的临床意义。然而恶性肿瘤往往具有空间异质性，这种异质性特点导致其

学位

影像组学图像配准恶性肿瘤分类算法特征提取

中医证候的复杂系统建模及其与疾病的相关性研究

本文作者的研究课题是基于国家重点基础研究发展计划(973计划)资助项目“证侯规范及其与疾病、方剂相关的基础研究”，课题研究的主要任务包括两部分内容：一部分是利用复杂系统

学位

复杂系统信息熵中医证候随机神经网络神经自动机

脉冲耦合神经网络在图像分割中的应用研究

脉冲耦合神经网络(Pulse Coupled Neural Network, PCNN)是一种有着生物学背景的新一代人工神经网络,与传统人工神经网络(Artificial Neural Network, ANN)有着很大的区别。P

学位

脉冲耦合神经网络图像分割最大相关准则

基于视觉词包模型的行为识别

与本文相关的学术论文