【摘 要】
:
随着计算机技术的飞速发展以及人们对智能化设备需求的提高,人体行为识别已经成为计算机视觉领域热门研究方向之一,其广泛应用于公共安防、人机交互、虚拟现实、体育运动和医疗健康等领域,具有极高的理论研究价值。早期的研究工作主要针对于RGB视频图像,由于易受复杂背景、光照强度的影响,很难达到理想效果。但随着深度传感器技术的发展,高精度获取三维骨架关节点信息变得方便可行。对比传统RGB视频图像数据,骨架姿势信
论文部分内容阅读
随着计算机技术的飞速发展以及人们对智能化设备需求的提高,人体行为识别已经成为计算机视觉领域热门研究方向之一,其广泛应用于公共安防、人机交互、虚拟现实、体育运动和医疗健康等领域,具有极高的理论研究价值。早期的研究工作主要针对于RGB视频图像,由于易受复杂背景、光照强度的影响,很难达到理想效果。但随着深度传感器技术的发展,高精度获取三维骨架关节点信息变得方便可行。对比传统RGB视频图像数据,骨架姿势信息对行为的描述有其内在优势,它不仅能够更准确地描述人体姿态和运动状态而且不受背景复杂度及光照强度等因素的影响,因此骨架信息被广泛应用于行为识别。本文对基于人体骨架关节点的行为识别展开研究,所做的主要工作如下:(1)对于输入的骨架关节点数据,提出利用人体结构及人体关节运动特性预测缺失的关节点数据,并提取归一化关节向量和关节向量夹角作为姿态特征,最后采用K-Means聚类算法选择关键帧。行为识别中,关键帧序列的选择不仅减少了数据的冗余,降低行为识别过程中的特征数量,而且增强了对行为物理意义的表达,直接影响行为分类的准确率。(2)关键帧序列选择的本质是一个优化问题,提出将关键帧选择问题转化为二进制编码空间下的优化问题,为此设计了一种基于融合域信息和关键帧数目的评估模型,将行为序列划分为多个域,在充分保留运动时序性的同时,根据压缩率自适应调节关键帧数目。设计了一种基于多种群的多目标差分进化算法(Multi-Population based Multi-Objective Differential Evolution Algorithm,MMDE),提出拐点帧的概念,以拐点帧作为种群初始化标识并重新定义了种群初始化规则,同时对差分变异算子和选择算子进行改进,提高算法的全局搜索能力。(3)为了验证方法的有效性,在MSR-Action3D、UTKinect-Action和Florence3D-Action 3个公共数据集上进行了仿真实验,在基于K-Means选择关键帧的行为识别中,对比了在不同分类器上的行为识别效果,相对于原始序列及等间隔帧采样帧,行为识别准确率均有提升。在基于优化方法选择的关键帧行为识别实验中,与目前文献中主流方法的识别效果作了比较分析,并分析了拐点帧的作用,同时讨论了有无拐点帧加入的效果和划分域的意义。在行为识别问题中,本文提出的关键帧提取模型在一定程度上减少了行为序列的特征冗余,增强了行为物理意义的表达,可有效提高行为识别的效果。
其他文献
随着信息时代的发展,数据量日益增加。云存储技术的出现对数据的存储和共享带来了很大的便利,同时也带来了巨大的安全威胁。云存储服务器(Cloud Storage Server,CSS)往往容易受到外部敌手和内部敌手的攻击,采用普通的加密技术虽然可以保护数据隐私,但在使用时需要将远程文件全部下载到本地逐一进行解密,这无疑增加了系统资源的浪费。尽管数据加密被认为是保护数据机密性的一种简单而且有效的方式,但
人脸表情识别技术在人机交互、智慧交通和医疗等领域有广泛的应用,在计算机视觉和深度学习等领域也取得了越来越多的关注。人脸表情识别的核心技术之一是图像特征表达,目的是提取到辨识力高、鲁棒性强的特征。现已有众多学者针对人脸表情识别的关键技术开展了一定的研究工作,但在提高识别精度方面仍然是一个巨大的挑战。本文以人脸表情识别技术中的特征学习和显著性区域检测等关键问题开展研究工作,提高了识别方法的精度。主要研
图像超分辨率重建方法是通过硬件或软件的方式,将高分辨率图像从一系列相关的低分辨率图像中恢复出来的过程。当前,在实现图像超分辨率重建的方法中,机器学习和深度学习是两个对图像重建质量较好的方法。因此,本文基于这两种方法对图像重建算法进行了研究。基于邻域嵌入的自学习图像超分辨率算法是一种基于机器学习的算法。提取图像深层特征的超分辨率重建网络是一种基于深度学习的算法。本文对图像超分辨率研究的主要内容有:(
携能双向中继网络(Two-Way Relaying Network,TWRN)利用能量收集(Energy Harvesting,EH)技术,能够在完成高可靠性通信的同时延长中继节点的工作寿命。已有针对携能TWRN中系统中断性能的研究大多基于理想硬件假设,即不考虑各类损伤(如高功率放大非线性、射频电路噪声等)对收发机的影响。然而,在实际的通信网络中,收发机不可避免地会遭受着诸多因素的影响。尽管已相继
人脑在人类情感的产生过程中起到了至关重要的作用,基于脑电(Electroencephalogram,EEG)的情绪识别研究日益得到国内外学者的关注。有效挖掘大脑的功能机制为情绪识别提供了新的见解,对系统级视角下理解人脑组织的连接模式以及情绪产生的方式至关重要。认识人脑不同脑区在功能上分工与协同的规律是情绪分析的关键,然而现有的情绪识别研究在这一方面存在两个不足之处:研究者对于大脑的探究多从能量角度
视觉跟踪是计算机视觉领域的一个重要研究方向,在自动驾驶、军事侦察、视频监控、人机交互、无人机等领域都有广泛的应用。视觉跟踪的主要目的是在视频序列中,根据给定的初始目标信息在后续视频序列中预测该目标的位置、尺度、运动状态等信息。近年来,越来越多的研究人员从事跟踪算法的研究,各类跟踪算法在跟踪性能上都不断提升,但在目标遮挡、光照变化、快速运动、目标形变等复杂场景下的跟踪性能仍不够理想,所以,对跟踪算法
大规模多输入多输出(Multiple-Input Multiple-Output,MIMO)技术通过在基站端布置大量天线,利用信道之间的渐近正交性,可以有效消除用户间干扰,同时给通信系统带来巨大的性能提升,而成为5G的关键技术并被广泛使用。在大规模多用户MIMO(Multi-User MIMO,MU-MIMO)系统中,不正确的用户分组会引起严重的用户间干扰,因此多用户选择对大规模MIMO系统性能至
水是人类生产活动和社会发展中不可缺少的重要资源。但近年来随着城市化和工业化步伐的加快,导致水污染问题日益突出,水质监测已经成为水资源保护和利用的关键问题。我国是传统的农业大国,农业生态环境的优劣与我国的可持续发展战略息息相关,这其中农业生产灌溉用水的安全性更是直接影响农作物品质。我国以全球8%的耕地面积养活全球20%的人口,创造“中国粮奇迹”根本原因之一是我国有40%的耕地类型为灌溉农田和建立在水
验证码的作用是区分人与机器,在互联网时代早期图像验证码具有非常好的效果。近年来,软件技术飞速发展,特别是深度学习方面的技术突破和硬件突破将AI技术引入了全新的时代。AI技术在图像识别和处理的优秀表现,给图像验证码的核心功能带来了严重挑战。相较于传统基于OCR技术的文字识别破解验证码,基于深度学习技术的破解系统破解的准确率更高、效果更好。于是各式新颖的验证码系统层出不穷,但这些新兴验证码操作逻辑不够
随着大数据时代的来临,需要分析处理的数据程指数型增长。降维技术作为数据挖掘预处理技术的重要组成部分,它能有效地减少学习算法的计算复杂度,从而使得传统的学习算法处理大规模数据成为可能。而特征选择作为降维技术的一种,因为其降维后的数据具有可读性高以及不改变数据结构的特点,被广泛应用于各个领域。该方法的步骤主要分为两个部分,生成特征聚类结果和聚类后的特征选择。但是在基于聚类的特征选择算法中依旧存在以下四