【摘 要】
:
监控系统已经广泛地应用在我们的日常生活中,极大地保障了人们生命和财产的安全。随着科技进步,其发展也越来越趋向于智能化。固定摄像头的监控往往容易存在死角,而小型无人机由于其灵活性,成为监控系统中一个很好的补充,近年来在安防监控领域发挥着越来越重要的作用。人体行为识别是视频理解中的一项关键技术。考虑到无人机平台的算力有限、识别速度要求,以及无人机航拍视频中人体动作的特点,本文对无人机航拍视频中的人体行
论文部分内容阅读
监控系统已经广泛地应用在我们的日常生活中,极大地保障了人们生命和财产的安全。随着科技进步,其发展也越来越趋向于智能化。固定摄像头的监控往往容易存在死角,而小型无人机由于其灵活性,成为监控系统中一个很好的补充,近年来在安防监控领域发挥着越来越重要的作用。人体行为识别是视频理解中的一项关键技术。考虑到无人机平台的算力有限、识别速度要求,以及无人机航拍视频中人体动作的特点,本文对无人机航拍视频中的人体行为识别方法重点进行研究,论文主要工作如下:(1)针对无人机平台算力的局限性,提出了一种轻量化人体行为识别模型(LCNS)。首先采用稀疏采样避免冗余的计算,模型的特征提取网络选取了Mobile Net V3,有效减少参数量和计算量。传统的TSN模型直接聚合不同帧的信息,无法利用帧间的时序信息,因此我们利用自注意力机制,建模不同帧之间的时序关系。此外,针对训练样本难易程度不一致问题,采用Focal Loss对损失函数进行改进,对简单样本降权,使模型在训练过程中更关注困难样本。(2)针对无人机航拍视频中人体尺寸较小、运动幅度不明显的特点,在LCNS模型基础上引入光流导向特征。鉴于传统光流提取十分耗时,LCNS模型的输入仅采用了RGB图像,缺乏对运动信息的理解。考虑到光流强大的运动信息提取能力,在兼顾识别速度的基础上,本文引入了光流导向特征来提升识别准确度。光流导向特征采用网络端到端学习,无需手动提取。(3)考虑到轻量化特征提取网络的参数有限,特征提取能力受限,引入知识蒸馏对模型进行进一步优化。教师网络选取了在Kinetics数据集上预训练的I3D模型,首先训练教师网络,然后在训练过程中让学生网络拟合教师网络的输出结果,使得教师网络中的隐藏知识传递给学生网络。在不增加学生网络参数量和计算量的情况下,进一步提升行为识别模型的性能。为了验证本文模型在无人机视频下的行为识别效果,我们自主采集标注,建立了无人机视频行为识别数据集。最后,本文在无人机行为识别数据集以及开源的标准行为识别数据集HMDB51和UCF 101上进行充分的实验和案例分析,验证了本文提出的轻量化人体行为方法的优越性。实验表明,模型在UAV、HMDB 51、UCF 101数据集中准确率分别达到了88.81%、55.78%、87.19%,VPS达到了119,实现了实时的行为识别。
其他文献
本文通过对南京大学苏州校区规划与设计过程的思考和总结,探讨了延续式设计思维在校园规划中的实践方式。首先,通过中西语境下校园规划模式的对比,反思我国大学概念的由来;其次,在回顾近代以来高等教育机构发展脉络的基础上,以南京大学鼓楼校区(金陵大学旧址)的校园空间结构演化为研究对象,梳理以教会大学为基础的历史性校园规划结构的成因与演变;最后,通过设计方案对历史文脉的思考,对场地回应方式的推敲,以及对未来教
随着深度学习技术的蓬勃发展,目标识别技术在民用和军事领域中发挥着越来越关键的作用。本文主要研究无人机载热红外图像中行人及车辆识别方法,主要工作反映如下:(1)无人机载热红外图像行人及车辆数据集构建。通常为了训练一个深度神经网络模型,需要大量的数据样本。然而,目前极少有公开可用的针对无人机视角下行人及车辆的热红外数据集。因此,本文采用大疆无人机DJIM600 PRO搭载FLIR热红外相机Vue Pr
使用光气为原料进行酰基化反应是工业上合成氯甲酸酯的重要方法之一。氯甲酸酯类化合物是用于农药合成的重要中间体。光气和1-辛硫醇为原料可以合成氯甲酸辛硫酯,该反应较为缓慢,在已知的方法中往往需要使用与光气当量的叔胺作为缚酸剂和溶剂以促进反应的进行。采用催化量的三乙胺作为催化剂,采用无溶剂的方法合成了氯甲酸辛硫酯,得到了一种特别适用于大规模工业化生产的氯甲酸辛硫酯合成方法,并探讨了三乙胺催化氯甲酸辛硫酯
空间技术发展对完成复杂任务的需求日益增加,如抓捕或转移空间碎片和废弃卫星、维修或更换有故障的在轨航天器、通过加注燃料延长卫星的寿命等,这些任务要求追踪/任务航天器近距离精确估计空间目标的相对位置和姿态。空间目标常可分为合作目标和非合作目标两类,依赖于明显的合作标识或星间链路等辅助进行位姿测量,合作目标的相对位姿估计技术已趋于完善且已多次成功进行在轨验证。相比于合作目标,非合作目标没有安装通讯应答机
胰高血糖素样肽1受体(GLP-1R)激动剂具有出色的降血糖作用,虽然已有多个肽类GLP-1R激动剂被批准用于治疗II型糖尿病和/或肥胖,但是以GLP-1R为靶点的新型降糖药仍是研发热点。本文将对已上市的5种肽类GLP-1R激动剂的非临床生殖和发育毒性特征进行概述。【艾塞那肽】大鼠I段:未见对生育力的损害。大鼠和家兔II段:在临床暴露水平(Clinicalexposurelevel,CEL)母体均出
视频合成孔径雷达(简称,视频SAR)由常规SAR发展而来,继承了常规SAR的优势,同时具备对目标场景进行快速连续成像的能力。运动目标检测一直是视频SAR领域的研究热点之一,但是视频SAR的传统运动目标检测算法对帧间SAR图像配准要求极高,而使得检测性能下降。近年来,基于深度学习的目标检测算法因其优秀的检测能力而备受关注,随着深度学习的不断推广,越来越多的领域开始与深度学习相结合。不少学者已经将深度
<正>糖尿病(diabetes mellitus, DM)是最常见的慢性疾病之一,我国是世界上糖尿病患者最多的国家,成人糖尿病患病率已高达11.9%,其中2型糖尿病(type 2 diabetes mellitus, T2DM)约占90%,肥胖和超重人群糖尿病患病率显著增加。T2DM是由胰岛β细胞功能衰退、胰岛素作用缺陷以及胰高血糖素分泌异常等共同作用所导致。胰高血糖素样肽-1受体激动剂(gluc
目的探讨超重或肥胖早期2型糖尿病(T2DM)患者的优选序贯治疗方案。方法选取2018年10月至2020年10月在广东省中西医结合医院门诊或住院的90例早期超重或肥胖T2DM患者,采用随机数字表法分为对照组、达格列净组和序贯治疗组,每组30例。对照组予以二甲双胍0.5 g/片,2片/次,口服,2次/d;达格列净组予以达格列净10 mg,口服,1次/d;序贯治疗组予以聚乙二醇洛塞那肽0.2 mg,皮下
深空探测是继卫星应用技术和载人航天技术之后的又一个航天技术发展领域。随着全球各个国家和地区在航天事业上的发展和竞争,深空探测已成为现在以及未来研究的热点之一。为了保证深空探测活动的顺利进行,确保航天器之间、航天器与地面站以及空间站之间的正常通信显得至关重要。目前PSK、PAM以及QAM等线性调制方式仍然是深空通信研究的主流,伴随着现阶段深空探测的深入发展以及探测任务的增多,线性调制方式逐渐无法满足
行人检测是机器视觉领域的一项重要研究课题,在智能交通、行人重识别、行为分析、智能机器人等场景中发挥着关键作用。为了准确、快速、稳定地检测各种场景下、各种姿态、各种尺寸的行人目标,众多行人检测算法相继提出。本文在前人工作的基础上,深入研究了多种基于视觉的行人检测方法,并提出了相应的改进方法,主要工作如下:首先,提出了一种基于选择搜索(Selective Search,SS)算法和可变形部件模型(De