基于深度卷积网络的高铁站台密集行人检测算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:lhl1208
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高铁站台行人检测是高速铁路运维和保障的一项关键技术,对保证高速铁路运行的安全起着至关重要的作用。然而高铁站台的人流量大、行人分布密集,行人尺度变化大,相互遮挡严重,导致现有的目标检测方法存在精度低、漏检率高的问题。为此,本文提出基于深度卷积网络的高铁站台密集行人检测算法研究的课题,从高铁站台行人数据集构建、小尺度和遮挡检测算法设计等方面,开展高铁站台密集行人检测技术研究,对提升高铁站台密集行人检测的精度具有重要的实用价值。
  本文主要研究工作如下:
  (1)面向高铁站台场景的行人检测任务需求,构建了一个高铁站台密集行人数据集HUST。数据集中共有2637张图片,其中包含33473个行人目标,平均每张图片有12.7个行人。数据集收集自十余个高铁站台,且涵盖多种尺度、不同遮挡程度的密集行人场景。通过使用FasterRCNN、SSD和RetinaNet目标检测方法在数据集上进行实验,发现通用目标检测算法在密集行人检测上存在漏检问题。
  (2)针对多尺度行人检测过程中,小尺度行人漏检率高的问题,提出了一种基于密集连接的多尺度特征金字塔网络(Densely Connected Feature Pyramid Network, DCFPN),利用密集连接的方式对不同尺度特征进行线性加权,融合深度语义信息和浅层纹理信息。同时基于行人宽高比相对稳定的特点,利用K-Means聚类算法估计行人的宽高比,进而设计适应行人检测的锚框,并分别在公开数据集和高铁站台数据集中进行行人检测实验,结果表明,与FPN相比,DCFPN的检测精度分别提高了1.1%和1.9%,漏检率分别下降了1.2%和1.4%。
  (3)针对密集遮挡行人检测中行人定位不准、漏检率高的问题,提出了一种基于引导注意力机制的遮挡行人检测方法(Guided Attention RCNN,GA RCNN)。该方法包括目标框引导注意力模块BGAM、遮挡预测分支OPB和面向遮挡的非极大抑制OccNMS。BGAM模块使用目标框引导生成空间注意力特征图,来进行特征增强,提升行人的定位精度;OPB分支用于预测行人框的遮挡率(Occlusion Rate,OR),接着OccNMS根据的遮挡率的大小动态设置不同的抑制阈值,使得遮挡严重的行人预测框能够保留。我们分别在公开数据集和高铁站台数据集进行了行人检测实验。结果表明,相比于RepLoss、MGAN等行人检测算法,GARCNN的检测精度分别提高了0.6%和0.9%,在遮挡严重区域漏检率分别下降了1.1%和1.2%。
  文本文从以上三个方面对行人检测展开了算法和实验研究。实验结果表明,本文提出的方法能有效提升密集行人检测的精度,同时,也降低了密集行人检测的漏检率,可以满足高铁站台场景、机场、广场等公共场所密集行人检测应用的要求。
其他文献
随着科技的进步与发展,人类已进入万物互联的物联网时代,其首要目的是提供以“人”为中心的智能化服务,特别是,对人体行为的准确感知和理解是必不可少的技术支撑。近年来,如何在特定环境下对人体的地理位置、运动轨迹、运动速度进行精确感知已成为研究人员的重点关注对象。传统人体运动感知系统大多基于计算机视觉、毫米波雷达、或者激光雷达等技术及其专用特殊设备,因而存在实现成本高以及难以大规模应用的缺陷。近年来,随着
学位
基于量子物理学的量子保密通信,利用量子信息技术在通信双方之间建立安全密钥,然后再将密钥用于保护通信数据的方案,从而达到保密通信的目的,具有更高的安全性,引起了密码学上的高度重视,被认为是未来发展潜力巨大的一种保密通信。量子密钥分发(QKD),作为量子保密通信的关键技术,是量子密码学中重要的一个研究方向。QKD以量子态为信息载体,依据量子力学的“量子不可克隆定理”和“海森堡测不准原理”,确保密钥的不
直升机桨毂是连接桨叶和旋翼轴的重要部件,直升机飞行过程中,结构复杂的桨毂承受复杂的交变应力,桨毂材料长时间受力将引发疲劳,进而萌生裂纹甚至断裂,埋藏安全隐患。对桨毂材料的健康实时监测并进行裂纹状态识别,对于保障直升机结构稳定、运行安全等方面具有重要意义。本文以直升机桨毂中央件的某钛合金材料为研究对象,通过疲劳断裂试验获取声发射信号,对桨毂材料疲劳裂纹的声发射特性展开研究,根据直升机桨毂裂纹声发射信
学位
车辆之间的通信既要求超可靠低时延,同时又对通信数据速率有较高的要求。毫米波(MillimeterWave,mmWave)在带宽上具有优势且能支持高数据速率通信,因此毫米波相关技术在车联网研究领域受到广泛关注。动态环境和高移动性是车辆通信的主要特点,且位于车辆和路边单元等通信实体上的天线高度相对较低,这三种特性为车联网通信的研究和信道建模增加了挑战性。以射线跟踪为代表的确定性信道建模方法通过计算特定
学位
无人飞行器等低空设备的存在使得低空空域管理规划具有重要的意义,但是低空环境存在着环境复杂,低空目标的“低慢小”特性,现有检测技术复杂等问题,导致低空小目标的检测与位置定位的难度要比高空环境中更高。本文旨在利用移动通信系统对低空小目标进行目标检测及定位,由于移动通信系统采用单接收通道模式的信号接收方式,移动通信信号的连续性提高了通信系统与检测系统融合的难度。因此本文就以上问题着重研究了如何结合移动通
图像采样技术是进行图像压缩、传输与存储等基本处理以及实现图像理解、分类与推理等人类高级认知行为的先决要素。但传统的香农—奈奎斯特采样定理在应对图像分辨率要求日益增长的大数据时代捉襟见肘,而且它不能有效地契合硬件设备的资源配置。因此,人们始终期望能够寻求一种“硬件压缩”的全新图像采样理论,以便能突破传统采样定理的限制,并且可以更合理地利用有限的资源。近年来,新兴的图像压缩采样框架正在逐步地向着这一目
无线传感网络是物联网重要组成部分之一,采用中继技术可以大幅提高传感节点信息传输的可靠性。传统中继协作的无线传感网络假设中继节点消耗自身的能量来协助源节点的信息传输,然而中继节点的电池容量非常有限,这无疑会严重缩减中继节点的“寿命”,导致中继协作的传感网络无法正常工作。因此,在保障基本通信服务质量的前提下,如何低成本的为中继节点稳定且持续地提供能量显得尤为重要。射频无线能量传输(Wireless P
随着全光网的发展,可编程波长选择开关(WSS)作为光交换节点中新一代可重构光分插复用器(ROADM)与光交叉连接器(OXC)的核心光学器件之一,具有波长无关、方向无关、竞争无关、灵活格栅等丰富的全光信号处理功能。具备高端口数的WSS可以极大地降低全光网中多维光节点的建造、运行和维护成本以及系统组成复杂性,此外WSS的精细光谱操控能力可大幅度提升光节点的网络扩展功能和组网灵活性。目前商用WSS主流端
生活中的每个人经常会因为一些外在因素或者个人原因而产生一些不好的情绪,比如沮丧、伤痛、害怕、恼怒、哀伤、忧郁等等,心理学家将这些坏情绪总称为负性情绪。此类情绪是消极的,对大学生群体尤其如此,因为这会影响大学生的学习与工作,甚至严重影响人的身心发展。故而采取有效手段来调节负性情绪已经成为当下关心大学生身心健康的一大积极有效的措施。近年来随着运动心理学的研究发现,适当的体育锻炼对改善负性情绪能起到积极
学位