基于图卷积的航拍人体异常行为识别

来源 :西南科技大学 | 被引量 : 0次 | 上传用户:firefly0808
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体异常行为监测对公共区域安全及城市安防建设意义重大。传统监控方式主要通过人工复检,易出现误检、漏检等问题。同时固定监控摄像头监测范围有限,灵活性不足。针对上述问题,面向航拍场景结合对环境变化鲁棒性较好的人体姿态信息,本文研究了基于图卷积的航拍人体异常行为识别。(1)针对嵌入式平台存储与运算性能有限的问题,设计了一种轻量化人体姿态估计网络。基于高分辨率表征学习网络(High-Resolution Representation Learning Network),缩放网络深度与宽度;引入轻量化Shuffle Net模块减少模型参数量;同时设计条件通道加权单元替换其中点卷积操作,进一步减少模型时间运算复杂度,提升算法运算速度。在COCO 2017人体姿态估计数据集上实现性能验证,并对算法实时性进行分析。(2)为实现基于人体骨架信息的行为识别,设计了一种引入注意力机制的双流时空图卷积网络。利用人体姿态关节点信息,构建人体时空骨架序列图作为输入特征;在时空图卷积ST-GCN(Spatial Temporal Graph Convolutional Networks)基础上,设计了一种时空-通道注意力模块,从多维度提取特征信息;设计双流网络,通过关节点提取骨骼信息,分别输入双流网络,将双流网络输出加权融合后实现动作行为分类。在大规模行为识别数据集NTU-RGB+D上完成方法验证,两种基准(X-Sub和X-View)下识别精度可达84.4%和91.2%。(3)为进一步提升行为识别性能,针对空间图卷积层难以捕获无物理连接的关节点之间的联系,引入了一种自适应图卷积层,通过参数化全局子图与个体子图,提升图卷积层特征提取能力。其中,全局子图和个体子图分别为基于数据集和样本数据的拓扑图结构;设计门控机制对上述两种子图结构在不同网络层中的重要性进行自适应调整。在NTU-RGB+D数据集两种基准下识别精度可达87.4%和94.4%。(4)针对航拍场景实现人体异常行为识别。因公开数据集缺乏,自建航拍场景人体异常行为识别数据集AHB-AS(Abnormal Human Behavior in Aerial Scene)。实验表明,基于该数据集,本文方法识别精度最高可达95.45%,具有比较优势,能够满足任务需求。
其他文献
在航空航天、空气动力学等领域中,摩擦阻力的测量一直是研究的重点。在摩擦阻力作用下,流体运动能够表征边界层的状态变化。摩擦阻力不仅是描述湍流边界层的一个重要物理量,同时摩擦阻力对于航空飞行器的外壳设计方式也有相当重要的参考价值。本文首先对近年来的摩擦阻力测量方法展开了调查。对比众多方法选择了荧光油膜全局测量技术,以这项技术为基础开展了荧光油膜全局测厚及摩阻测量误差分析研究。首先着手于荧光油膜全局测量
学位
核素识别技术是我国核技术和核工业的发展中的关键性技术,同时也是保障国家核安全的基石,传统核素识别的主要思路是寻找核素能谱中的特征全能峰等核素的特征信息,然后将其与标准核素库中的核素信息进行匹配,从而达到识别核素种类的目的。但是由于实际测量环境中存在较多噪声污染、多种核素相互淹没与干扰,导致得到的核素能谱较为复杂,而传统的寻峰-匹配法无法满足对此类复杂能谱的识别要求,存在误差较大、鲁棒性较差和识别率
学位
相比于传统基于插值、重构及硬件设备等方法进行CT图像超分辨率重建,基于深度学习的方法能够获取纹理连续性好,感兴趣区域特征突出的重建图像,且算法的成本更低。因此本文以深度学习的图像超分辨率重建算法为基础,主要针对注意力机制,残差特征提取及图像的上、下采样技术进行分析和研究。具体内容如下:(1)提出了基于UNet特征融合的超分辨率CT图像重建(UNet SR)。首先,关于通道注意力(Channel a
学位
肺部疾病的患病人数逐年增多,改善肺部疾病的早期诊断和治疗,从CT图像中自动进行肺部分割是临床决策的一项关键任务。然而,由于肺的形状、大小不规则、对比度低和边界模糊,分割肺实质区域是一项非常具有挑战性的任务。现有方法中基于低级手工特征的方法易导致欠分割,基于CNN的浅层网络无法提取更具辨别力的特征。随着深度学习在图像处理领域取得了重要突破,将深度学习与计算机辅助诊断结合识别肺部图像成为了一个热门的研
学位
室内外空气污染已经成为现代社会普遍关注的问题。尽管在过去的几十年中,世界范围内颁布了许多关于空气质量的政策和法规,但空气污染仍然在对人类健康产生负面影响。挥发性有机化合物(Volatile Organic Compounds)是大气污染之一,它的治理问题引起了研究者的关注。二氧化钛(TiO2)半导体光催化材料具备高效无毒、稳定性好、经济环保等优势,因此使用TiO2作为光催化剂降解污染物是解决大气污
学位
图像语义分割是一项关键视觉技术,其目的是为图像中所有像素分配对应的语义标签。经过多年发展,图像语义分割已取得了不少成果,但由于分割任务的复杂性、以及深度学习的局限性等原因,仍有许多问题待解决。例如,无法很好保存边缘细节特征;在提取语义上下文和充分利用特征信息方面效果不佳,导致特征表达能力不足;网络参数量过大。因此,针对以上问题,本文对基于卷积神经网络的图像语义分割进行深入研究,并从解决皮肤镜图像病
学位
核事故发生时,由于核环境内部辐射剂量过大,人类无法进入现场进行后续操作,核应急作业机器人作为少数能进入核事故现场的机器,在解决事故时起到重要作用。部分核应急作业机器人上带有图像采集模块,采集到的图像数据是机器人对内部环境感知的重要依据。然而,核环境中的高能粒子会同图像采集模块中的半导体材料发生辐射效应,导致采集到的图像中含有大量核噪声亮斑。本论文针对灰度核噪声和彩色核噪声分别提出了对应的降噪算法,
学位
作为非语音音频分类任务中最重要的研究领域之一,声音事件识别被广泛应用于音频监控、音频场景分析、生物声学监测、医疗诊断等领域。声音是信息传播的主要途径,通过分析声音中携带的信息指导人类的生活和生产,提高生活生产效率。传统的特征提取器在设计的时候需要研究者具有大量的先验知识以及进行复杂的计算;传统的人工设计的网络模型对声音进行建模,其精度难以达到令人满意的结果。本文将使用深度学习的方法解决声音事件识别
学位
现代社会中,人们对安全隐私更为看重,对独居老人的看护系统也愈加智能化与人性化,深度学习算法的融入也使得其市场应用前景更为广阔。看护系统中人体异常行为识别算法也同时成为了大量国内外学者的热门研究内容。为了提升老人看护系统的精确性且同时能够保障用户的隐私安全,本文提出了一种基于红外光场景的家庭看护的异常行为智能识别方案,此方案由人体目标提取处理、训练行为识别网络以及异常行为判别等环节组成。在人体目标提
学位
由于生物特征识别技术在保持便携性的同时,比传统的个人身份验证方式有更高的安全性,所以得到了广泛的关注。其中,依靠手指静脉图像进行身份识别的技术因在现有的生物特征识别技术中拥有更高的安全性而快速发展起来。人工设计算子表达手指静脉图像中纹理信息的方法由于处理步骤繁琐并且鲁棒性和泛化性较弱,逐渐被特征提取能力更强的卷积神经网络方法替代,但是与此同时,这也提高了对运行设备算力的要求。因此,需要研究卷积神经
学位