面向人身安全的红外视频人体行为识别与定位

来源 :东华大学 | 被引量 : 0次 | 上传用户:wdwm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉是人类观察和理解世界的一个重要途径,而机器视觉中的一个重要任务就是通过准确地理解人体行为动作来更好地实现人机交互。与此同时,视频数据随着网络技术的发展正在海量增长,而视频人体行为识别与定位由于在视频安防监控、视频检索以及人机交互中的巨大应用价值也引起了越来越多的机器视觉工作者的重视。
  由于计算机自动识别出视频中危害人身安全的行为动作后进行自动报警,可最大程度地减少受害人的伤害,具有重要的视频分析价值。同时由于很多危害人身安全的行为大多发生在夜晚或者黑暗无光的环境下,而人体在热红外摄像中即使是夜晚也显得十分清晰,因此本文主要研究的是面向人身安全的红外视频人体行为识别与定位。
  针对红外视频人体行为识别的研究极少,红外数据集的人体行为种类也不够丰富的问题,本文首先构建了一个面向人身安全的红外视频人体行为数据集,该数据集共包含 23 个人体行为动作,其中有 8个是常见的危害到人身安全的行为动作。
  论文的主要创新点如下:
  1、提出了基于时空双流卷积神经网络的红外行为识别方法。时空双流卷积网络包含两条网络流,其中空间卷积网络通过融合红外图像及其对应的光流图像特征来学习该红外图像中真正发生运动的空间信息,时间卷积网络通过学习光流图像序列来学习人体行为动作的帧间变化信息。针对视频长短不一的问题,本文首先将红外视频进行平均分段,然后从每一段视频中随机抽取相应数据进入时空双流卷积网络得到每一段视频的识别结果,最后再将每一段的结果进行融合得到红外视频人体行为识别结果。
  2、提出了基于结构化分段卷积神经网络的红外视频时序行为定位方法。首先将一段包含多个人体行为动作的红外视频输入时空双流卷积神经网络得到每一帧为动作的概率,其次通过时序动作聚类模型得到该视频的建议动作视频片段,其中每一个片段都包含该片段所属的动作类别、在原始视频的开始及结束时间。然后将所有的建议动作视频片段输入结构化分段网络得到每一个建议动作视频片段特征,最后通过动作分类模型和位置回归模型得到对该视频预测的所有动作视频片段。
其他文献
在煤中含量低于100μg/g的元素称为痕量元素,煤燃烧过程中痕量元素排放特性的研究已成为燃烧污染控制领域的一个热点和前沿课题。痕量元素及其化合物会污染包括大气、水体以及土壤在内的环境,一些痕量重金属元素不会被生物降解,易在人类及动植物体内富集,进而危害人类及动植物的健康。特别是一些易挥发的痕量元素或其化合物,它们不能被常规的除尘装置(如电除尘器,布袋除尘器等)有效捕获,无控制地大量排入大气,成为环
学位

随着化石燃料的日益枯竭和全球能源需求的持续增加,环境问题变得日益严峻。由于光伏组件及其系统的技术进步和政府对清洁能源的激励,光伏发电系统的成本逐年下降。在过去几十年中,光伏的累计装机容量在全球范围内以极高的速度增长。光伏发电系统的大规模并网给电力系统的稳定和安全运行带来了重大冲击。因此,光伏发电系统接入电网需要一种有效的控制策略,该策略应能确保系统在电网正常和故障条件下均能良好运行,并满足可再生能
漏电是矿井低压电网的一个主要故障类型,同时也是影响工矿企业供电安全的重要因素。由于漏电信号微弱、易受干扰,漏电机理较为复杂,目前现有的漏电保护判据都有各自的局限性,矿井电网漏电故障识别问题始终存在。因此,漏电保护判据的研究对提高矿井低压电网供电安全有着重要意义。  本文以矿井低压电网为研究对象,建立了可描述单相漏电全过程的瞬时序网络模型,分析模型给出了各线路零序全电流、零序全电压等特征量的数学表达
学位
水产养殖是我国的重要产业t但随着水资源的日趋匮乏,我国要继续扩大养殖规模,必须要对养殖密度进行控制,并提高自动化的水平,这就需要对严重影响水产生物的生长安全的水质参数进行实时监测。目前从国外直接引进的现代化养殖设备和监控系统价格昂贵,运行成本高,在国内无法广泛普及,而国产的水产养殖设备和监控系统尚且无法完全在现场进行部署。针对这一现状,提出了一种基于ZigBee技术的鱼塘水质环境监测系统,它的主要
学位
该文首先针对脉冲TEACO激光器的基本原理、放电激励技术、预电离技术、放电稳定性等方面进行了深入的理论分析,指出了TEACO激光器实现高重复率脉冲输出对电源系统的要求,为设计激励电路提供了理论依据.参与设计制作了一台重复率可达20Hz的脉冲TEACO激光器的电源系统,介绍了脉冲控制电路的组成和工作原理,详细分析了主放电电路的充放电过程,并进行了数学模拟.分析和讨论了电路中各种参数对主放电电压和电流
学位
该文将现代电子工艺中比较先进的成膜工艺——直流磁控溅射法,应用在PTCR元件的底电极的制备上,是一种全新的尝试,结果获得了高性能的与钛酸钡(BaTiO)系PTCR元件欧姆接触良好的,厚度1.0μm左右的溅射镍电极.结合实际生产需要,该课题就直流磁控溅射法制备高性能钛酸钡(BaTiO)系PTCR元件电极进行了较为详细的研究.研究内容主要包括:直流磁控溅射BaTiO系PTCR元件电极工艺研究、磁控溅射
学位
该论文的研究内容共五章.(1)绪论;(2)放电回路与放电开关;(3)TEA-CO激光器的几种典型预电离技术;(4)实验结果与分析;(5)总结.(1)绪论主要介绍了TEA-CO激光器的发展及应用,指出影响TEA-CO激光器功率提高的因素主要是高气压下的稳定放电和大负荷下高压开关的稳定工作,给出了课题的研究内容及意义.(2)首先分析了Marx发生器电路、Blumlein电路、充放电电路、电容-电容转移
学位
随着计算机科学与信号处理技术的高速发展,调制信号参数的估计与调制方式的识别在民用和军事领域都扮演着重要的角色,例如灾害的防御、地质、海洋的探查、电子信息的对抗,情报的侦察等领域。而调制信号参数的估计,如调制方式、载频等,是能够成功识别调制信号方式的重要前提。论文的研究内容主要包括:  1、根据信号的循环平稳性在抗噪性方面的优势,采用信号的循环自相关函数进行傅里叶变换得到信号的循环谱。在载波频率估计
学位
由于鱼眼镜头的视角可达 180°左右,因此其被广泛应用于医学成像、智能交通、视频群组会议和安防监控等领域中。在近年来兴起的高级驾驶辅助系统、虚拟现实与增强现实等领域中,鱼眼镜头也有着广泛的应用前景。相比于普通镜头,鱼眼镜头在带来更大视角的同时,也导致了严重的图像畸变。对于鱼眼图像畸变矫正算法,国内外的很多科研人员都做过相关的理论研究。然而,大部分的算法复杂度高,计算量很大,只能在高性能的PC上实现
学位