基于多样本与零样本学习的人体行为识别研究

来源 :北京交通大学 | 被引量 : 5次 | 上传用户：cn1976

【摘要】

：

人体行为识别是计算机视觉领域的研究热点之一,不仅具有重要的理论研究价值,还有着广泛的应用前景。近年来,尤其在公共安全领域受到了国家的高度重视。本论文依托于973计划课

【作者】

：

田艺

【出处】

：

北京交通大学

【发表日期】

：

2018年01期

【关键词】

：

人体行为识别时空局部特征词袋模型稀疏编码零样本学习结构SVM 域偏移现象

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

人体行为识别是计算机视觉领域的研究热点之一,不仅具有重要的理论研究价值,还有着广泛的应用前景。近年来,尤其在公共安全领域受到了国家的高度重视。本论文依托于973计划课题《面向公共安全的社会感知数据处理》,开展了对面向社会公共安全需求的人体行为识别问题的研究。在现实应用场景下,用于社会公共安全领域的视频类社会感知数据具有以下两方面特点:一方面,其中包含现实环境场景下的复杂人体行为。另一方面,其中涉及海量无标签视频数据与诸多突发性未知类别人体行为。针对这两方面的数据特性,本论文重点研究了“现实场景下的多样本人体行为识别”与“无标签数据中的零样本人体行为识别”。首先,对于现实场景下的多样本人体行为识别,本论文主要致力于研究利用视频原始特征挖掘出具有高鲁棒性和强判别力的视频表示。以局部时空特征与词袋模型相结合的人体行为识别方法为基础,提出了两种基于稀疏编码的多样本人体行为识别方法,大大提高了现实场景下复杂人体行为的识别正确率。主要工作和贡献如下。(1)基于局部上下文线性编码的多样本人体行为识别方法。本文提出了基于上下文与局部信息的线性编码方法(CLLC),对各视频内特征点进行编码。然后采用基于组别的稀疏表示分类方法(GSRC),利用获得的编码系数对测试视频进行分类。CLLC编码方法利用局部约束项以及上下文约束项充分获取了特征点之间的局部关联信息以及上下文信息。该编码方法克服了现有方法的两大不足:量化误差较大和损失局部特征时空上下文信息,降低了重构误差,提高了特征编码判别力,取得了更好的识别效果。(2)基于层级时空组稀疏编码的多样本人体行为识别方法。本文提出了基于层级编码的视频描述方法。在第一层中,利用局部一致性组稀疏编码方法(LCGSC)对属于同一视频的特征点进行编码。该编码方法结合组稀疏约束项与局部一致性约束项,同时获取了特征点的全局以及局部关联信息;然后,通过绝对位置估计(AL)以及相对位置估计(RL)方法对视觉单词在视频中的时空分布进行描述,充分获取了特征点的时空位置信息。在第二层中,利用LCGSC编码方法对属于同一类别行为的视频序列进行编码。该层编码将视频类别信息考虑在内,提高了视频表示的判别力。本文所提方法进一步解决了现有方法中存在的问题:独立编码致特征关联信息缺失、无序编码致时空信息缺失以及单层编码致高层信息缺失,大大提高了现实场景下复杂人体行为的识别正确率。其次,对于无标签数据中的零样本人体行为识别,本论文针对现有零样本学习方法在人体行为识别问题上存在的局限性,研究重点为挖掘有效的视觉至语义映射关系,将无标签数据映射至适当的语义空间。本文提出了两种具有时序保留特性的零样本人体行为识别方法,实现了对无标签视频数据中突发性未知人体行为的正确识别。主要工作和贡献如下。(1)基于最大间隔结构回归的零样本人体行为识别方法。本文通过构造最大间隔结构SVM模型,将学习视觉至语义映射的问题转化为最大化视频与其行为类别之间的判别函数的优化问题。该模型由全局子模型以及局部子模型构成,保证了识别方法的分类准确性以及视频序列的语义一致性,并充分获取了视频序列的时间动态信息。该方法很好地解决了现有方法中存在的时序信息缺失的问题,提高了对未知人体行为的识别效果。(2)具有样本对齐及动态保留特性的零样本人体行为识别方法。本文通过构造线性映射模型,分别为训练域与测试域学习视觉至语义映射关系矩阵。首先,在学习视觉至语义映射过程中,借助时间系数充分获取了视频序列的时间动态信息与语义一致性信息;然后,为测试域样本学习自适应映射矩阵,以同时获取训练样本以及测试样本的结构信息;最后,利用对齐正则约束项,促使各类别测试样本的语义表示与其真实标签的语义表示相对齐,从而保留复杂行为类别间的差异性信息。该方法解决了现有方法的三大局限性:时序信息缺失、域偏移现象严重以及类类间差异性信息缺失,大大缓解了域偏移现象,进一步提高了零样本人体行为识别的正确率。最后,本文整合所提出的人体行为识别方法,开发实现了智能人体行为识别系统平台。该平台包括两大功能模块:基于多样本学习的人体行为识别模块与基于零样本学习的人体行为识别模块。该平台通过可视化、人机交互等方式为用户展示了本论文的主要研究内容,让读者对本文所开展的理论研究有更为直观的理解。

其他文献

春玉米叶片光合生理参数对土壤水分的阈值响应及其生产力分级

试验设正常灌水处理和干旱胁迫处理,讨论春玉米叶片的光合生理参数对土壤水分的阈值响应并进行生产力分级。结果表明:正常灌水处理的叶片光合速率(Pn)、蒸腾速率(Tr)和气孔导

期刊

春玉米叶片光合生理参数土壤水分生产力分级武威

超声造影在颈部肿大淋巴结鉴别诊断中的临床研究

目的：通过研究颈部肿大淋巴结的常规彩色多普勒超声影像和超声造影表现，并与病理学“金标准”的结果进行比较分析，探讨超声造影在颈部肿大淋巴结性质鉴别诊断中的应用价值。方法

学位

颈部肿大淋巴结超声检查造影剂时间-强度定量分析

湖南省农村信用社内部控制机制研究

金融机构集合了各种风险,其风险与地区甚至国家的金融风险息息相关。金融行业的内部控制制度的完善是非常重要的,对各行业乃至整个国家的金融系统都有很大的影响。农村信用社

学位

农村信用社内部控制机制风险管理外部监督可持续发展

开征物业税对房地产市场的影响分析

房地产业是我国国民经济的支柱产业,对我国经济发展具有重要作用。近年来,我国房地产业发展迅速,房地产价格不断上涨。在刚刚结束的十一届全国人大五次会议闭幕会上,就房地产

学位

物业税房地产价格房地产市场房产税试点

企业全面预算管理及内部控制分析

全面预算管理和企业内部控制是现代企业必要的两种管理手段,全面预算管理是加强企业内部控制的重要工具。随着我国经济的快速发展和市场经济的不断完善,企业面临越来越大的竞

期刊

全面预算管理企业内部控制预算执行

基于本体映射的电子目录智能服务理论研究

电子目录在电子商务当中的应用不言而喻,在现今的海量信息的情况下,要让用户简化获取信息的方法,集成系统必须开发集成电子目录去满足这种简化需求,从而使得用户可以使用统一

学位

电子游戏的作品属性研究

根据我国现有法律,电子游戏的程序代码部分可以作为计算机软件,因此本文对电子游戏的程序代码的作品属性不进行探讨,在探讨“电子游戏的作品属性”时均指探讨独创性电子游戏

学位

电子游戏作品属性著作权视听作品

测土治理苏打盐碱种植水稻技术

盐碱地对作物形成的危害主要是由苏打、小苏打、氯化钠、硫酸钠4种钠盐引起的,其中苏打对作物生长危害最大,其余依次是小苏打、氯化钠、硫酸钠~（[1]）,苏打盐碱地因主要含有较多

期刊

生育期硫酸铝烟气脱硫石膏水稻生长盐碱地改良化学改良剂有效分蘖

湖南省农村金融产品持续创新动力评价研究

随着经济的发展,以城市为中心的金融业得到了飞速发展,新型金融产品不断涌现,而经济相对落后、基础设施较差、农民整体素质不高的农村几乎成为金融创新的盲点。但是,我国经济

学位

农村金融产品持续创新动力评价模型对策

我国知识型服务贸易发展策略研究

知识型服务贸易是在知识经济来临之际,随之而产生发展起来的一种贸易类型。贸易对每个国家来说都是很重要的经济增长因素,而在知识经济时代,服务贸易则突显出更大的经济增长

学位

服务贸易知识型服务贸易核心竞争力知识产权保护

基于多样本与零样本学习的人体行为识别研究

其他学术论文