【摘 要】
:
无人机视角下的露天目标检测与计数是近年来人工智能、计算机视觉领域的一项重要任务,主要运用深度卷积神经网络、特征融合等算法推算图像中露天目标的位置、数量与密度情况。现有工作和进展已经能够基本满足航拍图像中车辆的检测与计数以及街拍图像中的人群密度估计,但由于无人机航拍图像的背景复杂、目标较小等因素,通用目标检测算法经过多次下采样后容易造成对小目标的丢失。因此,对航拍图像中人、车辆等多目标进行同时检测与
【基金项目】
:
江苏省重点研发计划(社会发展)项目“基于多无人机自组织感知和视频深度挖掘的露天安全生产监控系统研发及应用示范(BE2019739)”的子课题——无人机平台下露天目标检测与计数; 江苏省重点研发计划(社会发展)项目,基于移动物联网和大数据挖掘的全民健身和体育竞技场馆信息服务系统及应用示范(BE2016778);
论文部分内容阅读
无人机视角下的露天目标检测与计数是近年来人工智能、计算机视觉领域的一项重要任务,主要运用深度卷积神经网络、特征融合等算法推算图像中露天目标的位置、数量与密度情况。现有工作和进展已经能够基本满足航拍图像中车辆的检测与计数以及街拍图像中的人群密度估计,但由于无人机航拍图像的背景复杂、目标较小等因素,通用目标检测算法经过多次下采样后容易造成对小目标的丢失。因此,对航拍图像中人、车辆等多目标进行同时检测与计数还有待深入研究。本学位论文以无人机航拍图像中行人、车辆等多种露天目标的检测与计数应用为研究目标,首先设计一种基于改进YOLO v4的露天目标检测模型,提升对于小目标的检测与计数精度。然后设计一种基于深度卷积网络的航拍图像行人检测与计数模型,以人体检测和生成密度图的形式估计当前人群拥塞情况。最后设计一种无人机平台露天目标检测应用系统,将上述算法落地,同时优化系统,提高系统可用性与稳定性。本文的工作创新主要体现在以下三个方面:(1)针对航拍图像中的露天目标检测与计数,特别是小目标问题,设计一种基于改进YOLO v4模型的露天目标检测方法,加强了适合小目标感受野的特征图融合,引入了注意力机制与空洞卷积池技术,使模型能够覆盖多种尺度大小的目标。在Vis Drone2021-DET数据集上进行检测与计数实验,实验结果表明本文设计的基于改进YOLO v4模型的露天目标检测方法能够有效结合低层特征信息与高层特征信息,提高检测精度。(2)为提高无人机航拍图像中行人检测与计数的精度,设计一种YOLO-CC(YOLO and Crowd Counting)网络结构,首先通过目标检测算法在低层特征图上进行人体检测,然后在高层特征图上,使用多尺度卷积神经网络与特征降维的方式生成人群聚集密度图。目标检测与生成密度图组合的方法,能有效提高计数精度,增强对小目标的注意力。在Vis Drone2021-COUNTING数据集上进行实验,结果表明YOLO-CC网络结构在无人机航拍图像中的行人检测与计数任务中有较好的检测与计数精度。(3)无人机平台露天目标计数应用系统设计与实现,将上述网络模型落地,并移植到云服务器上,使得该应用系统完成对露天目标检测与计数、行人检测与计数任务的自动化处理与分析。
其他文献
对于智能交通系统,自第五代蜂窝网络商业化以来,车辆的内容请求数量急剧增加,所产生的大量数据对车辆互联网(Internet of Vehicles,Io V)系统的及时性和稳定性有显著影响,且车辆具有一定的计算及存储能力,因此边缘缓存技术被应用于车联网。然而,由于边缘设备的计算和存储能力有限,很难保证所有内容都被缓存,并且设备的所有需求都能满足所有用户。针对这一问题,本文考虑了车辆请求的内容及车辆的
汽车保有量的增加和停车场建设的滞后,使得“停车难”的问题尤为突出。智能停车系统提供“硬件+平台+服务”一站式服务,极大地提升了驾驶员的停车效率和停车场的管理效率,有效地缓解了“停车难”的问题。但是,传统的智能停车系统主要目标是高效率和便捷式服务,通常存在中心化存储和数据安全问题:系统的中心化存储方式导致单点故障和信息不对称问题;系统平台相互独立且高度开放,数据的安全风险较高。本文基于区块链技术,设
随着时代的发展变化以及科技的进步更新,互联网及其各类终端已经成为人们生活中不可或缺的部分,也产生了诸如智慧城市、物联网等概念。由于人类社会中智能自治系统的数量不断增加,这些系统在感知、理解和预测人类行为的能力变得越来越重要。其中,人类轨迹预测基于人类运动的历史轨迹及所处环境等数据预测其未来一段时间内的运动轨迹,能广泛应用于城市交通、社交机器人、自动驾驶汽车等领域,因此具有重要的研究价值。近年来对行
现有网络架构不能胜任5G更低时延任务的要求。移动边缘计算被提出并认为是解决网络时延要求的一种可行技术,其将云计算环境下沉到更靠近用户的边缘侧以减少网络操作和服务时延,因此将移动边缘技术应用于车联网中,可以提升用户的服务质量。同时,有效的数据缓存有助于减少重复数据的再次传输,因此,在车联网中引入缓存策略可以降低传输成本,进一步提高网络性能。然而,车辆的存储空间是有限的,如何设计出一种适用于车联边缘网
建设中国特色、世界一流的高水平本科教育是我国高等教育强国战略的首要目标,通识教育具有非常重要的价值和作用。然而,高校通识教育课程存在学生人数众多、个体差异大、课时少、内容多、任务重、教学模式单一等问题,使得其教学效果往往低于预期。调查发现,大学生在选课时常以兴趣为主导因素,动机作为大学通识课程的一个重要选择因素,它与大学生的课程学习行为的关系非常复杂。本研究基于动机的视角,对混合学习环境下的大学生
车辆自组织网络(Vehicular Ad Hoc Network,VANET)在智能交通中发挥着重要作用,它可以降低驾驶员的交通事故风险,并提供多种娱乐设施服务。但是,由于VANETs的开放通信性质,车辆传播的信息很容易受到安全攻击。近年来,已有许多解决上述问题的方案被提出,但大多数方案都存在较大的计算和通信开销。在车联网实际应用场景中,车辆入网会经历注册与认证过程,车辆访问控制的认证是车辆间和车
近年来,由于电力市场的不断发展,改革也取得初步成果,发电和售电两者开放程度不断增加,月度集中竞价交易作为当前国内电力市场建设的重要内容也取得了一定的发展成果。然而由于月度集中竞价交易参与者具有不同的背景和特点,同时一些新的交易类型如碳排放权交易和绿证交易也在对稳定发展的月度集中竞价交易造成冲击。为了保障用户在月度竞价交易中能够以较低的成本满足电力需求,也为了优化市场主体的竞争格局,需深入理解市场交
随着监控摄像头和无人机等安防设备的快速普及,需要采用自动化的手段对日益增多的视频数据进行分析与理解。时空动作检测可以在未剪裁视频上识别出动作的类别、起止时间以及动作在每一帧中的空间位置,得到了业界越来越多的关注。针对算法在安防应用中,由行人密集场景导致的相邻动作实例间相互干扰问题,以及在不同算力设备和检测需求下模型性能差异较大的问题。本文提出行人密集场景下的动作检测算法与强泛化性在线动作检测算法。
目标检测是计算机视觉领域的基础问题,深度学习如今在常见的检测场景中已取得了广泛的应用,但是在实际的检测场景中由于存在各种干扰因素,如检测目标视角变化、相互遮挡、搭载设备计算能力受限等,导致最终的检测性能准确率低。随着目标检测的应用领域愈发广泛,人们对目标检测速度与精度的需求也日益增加。本文主要研究基于深度学习的车辆检测方法,聚焦于两大类难题,即轻量级设备的快速车辆检测问题与实际场景下多视角车辆的检
新一轮科技革命给世界带来了翻天覆地的变化,也正在驱动着一场新的教育变革。以人工智能、大数据、云计算为代表的新一代信息技术快速渗入教育教学领域,促进了学习方式及学习环境的变革。与此同时,发展智慧教育已成为我国教育信息化工作的重中之重。在科学技术和教育政策的双轮驱动下,各级各类学校、企业开始探索新一代学习环境的特征,智慧教室作为典型的学习空间,得到了广泛关注。面对丰富的智慧教室类型,不禁发问,何为智慧