【摘 要】
:
随着监控摄像头和无人机等安防设备的快速普及,需要采用自动化的手段对日益增多的视频数据进行分析与理解。时空动作检测可以在未剪裁视频上识别出动作的类别、起止时间以及动作在每一帧中的空间位置,得到了业界越来越多的关注。针对算法在安防应用中,由行人密集场景导致的相邻动作实例间相互干扰问题,以及在不同算力设备和检测需求下模型性能差异较大的问题。本文提出行人密集场景下的动作检测算法与强泛化性在线动作检测算法。
论文部分内容阅读
随着监控摄像头和无人机等安防设备的快速普及,需要采用自动化的手段对日益增多的视频数据进行分析与理解。时空动作检测可以在未剪裁视频上识别出动作的类别、起止时间以及动作在每一帧中的空间位置,得到了业界越来越多的关注。针对算法在安防应用中,由行人密集场景导致的相邻动作实例间相互干扰问题,以及在不同算力设备和检测需求下模型性能差异较大的问题。本文提出行人密集场景下的动作检测算法与强泛化性在线动作检测算法。主要研究内容如下:(1)本文提出行人密集场景下的离线动作检测算法。该算法为了避免提取到相邻动作的特征,引入了可变形卷积、通道注意力模块和Re-ID模型,从而提高视频段级别的检测性能;针对基于IOU的连接算法在行人密集场景下的不足,使用Re-ID嵌入特征来度量时序相邻的Tubelet间的相似度,从而改进原有的连接算法,提高了视频级别的检测性能。算法在自制的密集行人数据集上提升了2.34%的Frame-m AP和3.89%的Video-m AP,在UCF101-24数据集上提升了1.2%的Frame-m AP和1.5%的Video-m AP。结果表明该算法提升了在行人密集场景下的时空动作检测性能。(2)本文提出具有强泛化性的在线动作检测算法。该算法针对在线检测设置下无法观察继而利用未来帧而导致的模型性能下降问题,提出使用特权知识蒸馏和课程学习将教师网络学习得到的未来帧信息传递给学生网络,实验证明该算法可以提升模型在线检测性能。同时,针对不同设备算力差异导致的模型性能差异较大的问题,提出通过轻量级的动作表征度量模块来学习多时序尺度下的动作实例关系,以提高模型的时序尺度泛化性。与没有动作表征度量模块的算法相比,在从UCF101-24提取出的多时序尺度数据集上提升了6.88%的Frame-m AP和7.15%的Video-m AP。(3)本文开发了一个基于行人图片的动作检索系统。该系统可以根据预先采集到的行人图像,在实时输入的视频序列中进行特定行人的动作检索,若检索到的行人动作为危险动作,则会触发报警功能。
其他文献
建筑物是人类进行生产和生活的主要场所,建筑物位置、分布等空间信息对于基础地理数据库的实时更新、城市动态监测以及城市规划等应用具有重要作用。随着卫星观测技术的发展,遥感影像的空间分辨率已经达到亚米级别,单位图像内蕴含的建筑物特征信息更加丰富。复杂场景高分影像中的建筑物尺寸多样具有多尺度特性,且建筑物布局位置不规则、空间关系复杂。与传统的中低分辨率遥感影像相比,提取复杂场景高分遥感影像中建筑物的特征信
近年来,我国风能、光伏等可再生能源开发利用得到了大力发展,这些具有较强不确定性的可再生能源发电高比例入网给电网的稳定运行带来了极大挑战。抽水蓄能电站具有高效可靠的调节性能,能够很好地应对和缓解高比例可再生能源发电并网带来的这一冲击,因此,我国将在“十四五”期间加快抽水蓄能电站建设。较大规模(大中型)抽水蓄能电站一般地处偏远山区,建筑空间狭小,在电气设备高集成度与高可靠性的要求下,开展此类电站过电压
随着车联网的兴起,低剖面定向车载天线的需求日益增长。然而,现有的定向车载天线难以同时实现低剖面和宽带特性。因此,论文致力于研究双模谐振背射天线的设计方法。提出了基于本征模式理论的模式综合设计方法,通过同时激发扇形微带贴片辐射器中的多个谐振模式,形成了低剖面双模谐振背射天线的设计方法,研究并实现了一系列不同性能、满足车载应用需求的背射天线。主要研究工作包含以下四个方面:1.根据原型磁偶极子和扇形贴片
对于智能交通系统,自第五代蜂窝网络商业化以来,车辆的内容请求数量急剧增加,所产生的大量数据对车辆互联网(Internet of Vehicles,Io V)系统的及时性和稳定性有显著影响,且车辆具有一定的计算及存储能力,因此边缘缓存技术被应用于车联网。然而,由于边缘设备的计算和存储能力有限,很难保证所有内容都被缓存,并且设备的所有需求都能满足所有用户。针对这一问题,本文考虑了车辆请求的内容及车辆的
汽车保有量的增加和停车场建设的滞后,使得“停车难”的问题尤为突出。智能停车系统提供“硬件+平台+服务”一站式服务,极大地提升了驾驶员的停车效率和停车场的管理效率,有效地缓解了“停车难”的问题。但是,传统的智能停车系统主要目标是高效率和便捷式服务,通常存在中心化存储和数据安全问题:系统的中心化存储方式导致单点故障和信息不对称问题;系统平台相互独立且高度开放,数据的安全风险较高。本文基于区块链技术,设
随着时代的发展变化以及科技的进步更新,互联网及其各类终端已经成为人们生活中不可或缺的部分,也产生了诸如智慧城市、物联网等概念。由于人类社会中智能自治系统的数量不断增加,这些系统在感知、理解和预测人类行为的能力变得越来越重要。其中,人类轨迹预测基于人类运动的历史轨迹及所处环境等数据预测其未来一段时间内的运动轨迹,能广泛应用于城市交通、社交机器人、自动驾驶汽车等领域,因此具有重要的研究价值。近年来对行
现有网络架构不能胜任5G更低时延任务的要求。移动边缘计算被提出并认为是解决网络时延要求的一种可行技术,其将云计算环境下沉到更靠近用户的边缘侧以减少网络操作和服务时延,因此将移动边缘技术应用于车联网中,可以提升用户的服务质量。同时,有效的数据缓存有助于减少重复数据的再次传输,因此,在车联网中引入缓存策略可以降低传输成本,进一步提高网络性能。然而,车辆的存储空间是有限的,如何设计出一种适用于车联边缘网
建设中国特色、世界一流的高水平本科教育是我国高等教育强国战略的首要目标,通识教育具有非常重要的价值和作用。然而,高校通识教育课程存在学生人数众多、个体差异大、课时少、内容多、任务重、教学模式单一等问题,使得其教学效果往往低于预期。调查发现,大学生在选课时常以兴趣为主导因素,动机作为大学通识课程的一个重要选择因素,它与大学生的课程学习行为的关系非常复杂。本研究基于动机的视角,对混合学习环境下的大学生
车辆自组织网络(Vehicular Ad Hoc Network,VANET)在智能交通中发挥着重要作用,它可以降低驾驶员的交通事故风险,并提供多种娱乐设施服务。但是,由于VANETs的开放通信性质,车辆传播的信息很容易受到安全攻击。近年来,已有许多解决上述问题的方案被提出,但大多数方案都存在较大的计算和通信开销。在车联网实际应用场景中,车辆入网会经历注册与认证过程,车辆访问控制的认证是车辆间和车
近年来,由于电力市场的不断发展,改革也取得初步成果,发电和售电两者开放程度不断增加,月度集中竞价交易作为当前国内电力市场建设的重要内容也取得了一定的发展成果。然而由于月度集中竞价交易参与者具有不同的背景和特点,同时一些新的交易类型如碳排放权交易和绿证交易也在对稳定发展的月度集中竞价交易造成冲击。为了保障用户在月度竞价交易中能够以较低的成本满足电力需求,也为了优化市场主体的竞争格局,需深入理解市场交