【摘 要】
:
人体行为识别在人机交互、视频监控、虚拟现实等多个领域有着广泛的应用,是计算机视觉领域的重要分支。随着深度学习的发展,人体行为识别算法的性能不断提升,智能化程度不断加强。本文对行为识别算法进行深入的研究,针对常见的行为识别算法计算量比较大,自然场景下拍摄的视频内容丰富,冗余度高,无法直接使用行为识别算法等问题,提出了一种非常高效的、两阶段的行为识别算法,该行为识别算法不仅在公共数据集上取得了较高的性
论文部分内容阅读
人体行为识别在人机交互、视频监控、虚拟现实等多个领域有着广泛的应用,是计算机视觉领域的重要分支。随着深度学习的发展,人体行为识别算法的性能不断提升,智能化程度不断加强。本文对行为识别算法进行深入的研究,针对常见的行为识别算法计算量比较大,自然场景下拍摄的视频内容丰富,冗余度高,无法直接使用行为识别算法等问题,提出了一种非常高效的、两阶段的行为识别算法,该行为识别算法不仅在公共数据集上取得了较高的性能,而且可以成功应用于自然场景。本文的主要贡献如下:(1)结合骨骼数据与视频数据两者的优点,本文提出了一个新的“基于双流网络的RGB-D人体行为识别算法”(SV-GCN)能够同时使用视频和骨架数据,使得两类算法相互弥补,充分发挥各自优点。该网络可以被描述为以两种不同数据工作的双流架构,该模型包括(i)基于空洞卷积的快慢路径网络处理视频数据和(ii)基于图卷积的全局特征增强的人体动作识别算法处理骨骼数据。在两个基准数据集上与以前的行为识别方法相比,该模型取得了最新的性能,验证了在行为识别任务中的有效性。(2)针对视频摘要领域,提出了“基于全卷积网络和注意力机制的视频摘要算法”,该算法是由编码器、注意力机制、解码器组成,其中编码器是经典的卷积网络(比如Googlenet、VGG16等),注意力机制用于获取视频帧之间的长距离依赖关系并能根据视频帧的重要性分配不同的权重,解码器是双层的反转卷积,损失函数采用能够处理样本不平衡的Focal loss。在基准数据集TVSum上的实验结果表明,该算法以较大的优势超过DSN、FCSN等方法。(3)针对常见行为识别算法无法在真实场景使用的缺陷,提出了一种“基于图卷积的RGB-D人体识别算法”(AFS-GCN),该算法由基于全卷积网络和注意力机制的关键帧提取算法与基于图卷积的局部特征增强的人体动作识别算法组成。大量实验证明,AFS-GCN不仅解决了当前人体行为识别算法使用传统的随机采样法获取视频关键帧的问题,还弥补了行为识别算法无法应对自然场景的缺陷。
其他文献
随着物联网行业的快速发展及人们生活水平提高,对人体健康的要求也越来越高,其中睡眠作为人体健康的支柱之一,睡眠质量的好坏会直接影响人们的精神状态甚至寿命。健康睡眠也是人们对现代生活提出的新的要求。现今取暖方式很多,传统供暖设备像电热毯,采用电热丝进行加热,升温虽然较快,但是存在着温度波动幅度较大的问题,会造成人体水分的加速流失,空调暖气分布不均匀,且电费相对较高;而取暖器在取暖的同时,会造成皮肤干燥
乳腺癌作为世界上最为常见的癌症之一,不仅死亡率高,而且治愈率极低,如今已经成为影响女性健康的头号杀手。在医疗领域,乳腺癌的诊疗主要依靠早发现、早治疗,越早诊疗,患者的临床治疗效果越好。因此,准确识别病灶对于治疗乳腺癌是非常重要的。本文结合机器学习算法,在乳腺肿块穿刺活检量化的病理型数据以及乳腺肿瘤超声图像数据上进行相关研究,针对病人所处疾病的不同阶段,选择不同的辅助诊断模型。本文主要研究内容如下:
随着电动汽车的广泛应用,其充电设备作为必要配套设施也逐渐普及。电动汽车充电设备主要由充电机、充电桩、通信设备以及人机交互设备等组成,结构复杂,工作环境恶劣,易发生故障。由于充电设备在地理位置上分布非常广泛并且分散,这给充电设备的管理、维护等带来很大问题。本文针对电动汽车充电设备的特点,基于.NET平台开发了一套充电设备远程监控系统。该系统可实时监测电动汽车充电设备的工作状态和充电数据,能够及时发现
目前我国人口老龄化问题愈发严重,脑卒中(中风)在老龄化群体中发病率比较普遍,偏瘫是其主要表现症状。近年来因中风偏瘫、交通事故等引起的肢体运动功能丧失的人群逐渐增多,其中就包括手部运动功能障碍。手部包括腕部、掌部和指部,是我们身体最重要的器官之一,在日常生活中发挥着重要作用。传统的手部康复大都是通过理疗师实行一对一康复治疗,劳动量大且成本高,因此康复机器人成为了目前国内外研究的热点。本课题通过查阅大
因矿山爆破不充分导致岩石松动,为防止岩石掉落危害矿井工作人员的生命安全,需要专业人员担任排险工作。针对矿山内部地质情况较为复杂人工排险费时费力且存在一定的安全隐患问题,本文设计一款机器视觉机器人代替人工排险工作,解决了人工成本和矿井工作人员安全问题,推动了矿井排险自动化智能化。本文的主要研究工作如下:(1)本文对机器视觉排险机器人系统做出总体设计方案,通过机器视觉技术实时检测裂缝图像,获取相关图像
随着信息技术在各行各业的广泛应用,不同领域的数据呈现爆炸式增长。数据挖掘技术能够从海量数据中挖掘出新颖、有规律并且对决策有用的信息。特征选择是数据挖掘中非常重要的研究方向。作为一种应对“维度灾难”的有效方法,特征选择不仅能够降低数据挖掘算法的计算开销,而且还可以提高数据挖掘模型的性能。特征选择本质上是一个组合优化问题,因此,利用各类智能优化算法来解决特征选择问题已成为当前的研究热点。近年来,基于粒
人体视频行为识别是计算机视觉的重要研究方向,目前在异常行为监控、人机交互系统、视频检索等领域应用非常广泛,具有极高的研究价值。近年来深度学习技术的发展推动了人体视频行为识别的研究,但是由于人体动作本身的灵活性以及不同人行为习惯的差异性,需要充分考虑上下文信息以及空间语义与时间事件的非对称性,这有助于人体行为识别准确度的提高。因此本文提出基于时域扩张残差的双流人体行为识别网络和基于特征重用的双分支行