基于深度学习的人体行为识别分析研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:wangchuabnao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多年来视频监控在各类场所的安全保障任务中发挥了巨大作用,其应用范围也在不断扩大,但由于传统人工视频监控存在的成本高、易漏报、准确性低及效率低等问题,具有实时性和主动性的智能视频监控系统成为了视频监控发展的新方向。智能视频监控中需要处理的核心问题是对视频中人的行为进行识别和分析。在行为识别领域,传统方法中识别效果很大程度上依赖于人工提取特征的优劣,而人工特征的计算过程复杂,需要相关人员具有足够的计算机视觉背景知识,且所得特征泛化性不强;而采用深度学习方法的深度卷积神经网络模拟生物大脑对于视觉信息的处理过程,对图像特征进行自主学习从而实现特征提取,大大简化了传统人工特征提取的流程。本文主要对双通道深度卷积神经网络模型的结构和特征融合方法两个方面进行了研究与设计。在网络结构的设计中,模拟大脑视觉皮层处理视觉信号时所使用的腹侧通道和背侧通道,采用空间通道网络和时间通道网络分别处理静态信息和动态信息,实现两类特征的分别提取;在单通道网络的结构中采用了多个叠加具有小卷积核的卷积层的方式代替单层具有大卷积核的卷积层,在感受野大小不变的情况下提高了网络的识别能力且减少了参数数目;为了解决过拟合问题,采用了预训练、dropout和early stop策略。在特征融合方法的设计中,对比了优先视频特征提取的融合方法、优先静态特征与动态特征融合的融合方法以及直接视频特征融合方法,以KTH行为数据集为基准对比了不同方法的融合效果;特别地,在单帧特征到视频特征的提取过程中提出了以离散度为权重的加权平均方法,增强了特征的分辨力;此外,通过双通道模型与单通道模型的识别效果对比,验证了双通道结构的优越性。最后,在KTH行为数据集及CAVIAR项目监控视频数据上进行了实验。对于KTH行为数据集,直接端对端地训练得到多分类器,并通过特征融合后的识别效果比较验证了空间-时间双通道中提取的特征所具有的互补性质,最终实现了96.18%的平均准确率,超过了大多数人工特征提取方法的实验结果。而在以CAVIAR项目的监控视频数据为基础制作的数据集上,首先使用镜像变换和随机剪裁的方式扩增原始数据,然后采取分别训练多个检测器的方式,以滑动的时间窗口为单位实现了对不同行为的检测,平均检出率达到89.36%,验证了双通道深度卷积神经网络在监控视频行为识别中的有效性。
其他文献
高超声速飞行器具有高非线性,强耦合、快时变和不确定性严重等特性,其姿态控制系统的设计是复杂且难于实现的,因此高超声速飞行器姿态控制方法的研究成为了一个极具挑战性和
一直以来,天气与人们的生产、生活息息相关,灾害天气更是严重影响人类的社会生产与生活。所以,灾害天气的准确预报能有效避免生命和财产的损失,灾害天气的准确识别与跟踪成了
随着网络系统的应用不断的深入到人们工作的方方面面,高精度网络时钟同步系统的研究也越来越受到重视。而在众多的网络时钟同步协议中,同步精度最高的IEEE 1588协议更是具有
随着人们物质生活水平的提高,对玻璃瓶罐的需求量越来越大,而我国制瓶机行业普遍存在企业规模小、生产水平低以及产品质量差等状况。为了提高市场竞争力,改进制瓶机生产技术已成
随着近代商品包装工业的发展,人们对商品包装的外观、色调及画面的设计要求越来越高,但由于工艺、机械等因素,在印刷过程中不可避免的会出现如漏印、飞墨、污点、字符局部或
过程监测技术的出现是工业过程趋向自动化、智能化的标志,作为保障系统安全稳定运行的关键要素,其不可或缺性日益凸显。以往朴素的过程监测技术着眼于工业过程机理模型。然而
随着组织工程技术和制造技术的发展,组织工程法培养软骨组织成为一种趋势。但耳廓缺损修复不仅要形成软骨组织,而且还要尽可能的具有一定的抗水解性、韧性和柔软性,在高强度的压
脑白质疏松症(Leukoaraiosis,LA)一种由多种病因引起以认知功能障碍为主要表现的临床综合症。目前,对LA的诊断除行为测试量表外,影像学如MR图像检查是重要的诊断依据。临床研究发
现代军用仿真技术目前已发展成为武器装备研制过程中的有力工具。如何在有限的经费和实验条件下研制高性能的武器装备,已被越来越多的科技人员所关注。特别是在火控系统的设
本论文考虑无限冲击响应(IIR)数字滤波器的最大误差最小化(minimax)设计,主要针对设计问题的非凸性和稳定性约束条件,以及现有设计方法所得滤波器的带边群延迟和过渡带幅值响应