论文部分内容阅读
高铁站台行人检测是高速铁路运维和保障的一项关键技术,对保证高速铁路运行的安全起着至关重要的作用。然而高铁站台的人流量大、行人分布密集,行人尺度变化大,相互遮挡严重,导致现有的目标检测方法存在精度低、漏检率高的问题。为此,本文提出基于深度卷积网络的高铁站台密集行人检测算法研究的课题,从高铁站台行人数据集构建、小尺度和遮挡检测算法设计等方面,开展高铁站台密集行人检测技术研究,对提升高铁站台密集行人检测的精度具有重要的实用价值。
本文主要研究工作如下:
(1)面向高铁站台场景的行人检测任务需求,构建了一个高铁站台密集行人数据集HUST。数据集中共有2637张图片,其中包含33473个行人目标,平均每张图片有12.7个行人。数据集收集自十余个高铁站台,且涵盖多种尺度、不同遮挡程度的密集行人场景。通过使用FasterRCNN、SSD和RetinaNet目标检测方法在数据集上进行实验,发现通用目标检测算法在密集行人检测上存在漏检问题。
(2)针对多尺度行人检测过程中,小尺度行人漏检率高的问题,提出了一种基于密集连接的多尺度特征金字塔网络(Densely Connected Feature Pyramid Network, DCFPN),利用密集连接的方式对不同尺度特征进行线性加权,融合深度语义信息和浅层纹理信息。同时基于行人宽高比相对稳定的特点,利用K-Means聚类算法估计行人的宽高比,进而设计适应行人检测的锚框,并分别在公开数据集和高铁站台数据集中进行行人检测实验,结果表明,与FPN相比,DCFPN的检测精度分别提高了1.1%和1.9%,漏检率分别下降了1.2%和1.4%。
(3)针对密集遮挡行人检测中行人定位不准、漏检率高的问题,提出了一种基于引导注意力机制的遮挡行人检测方法(Guided Attention RCNN,GA RCNN)。该方法包括目标框引导注意力模块BGAM、遮挡预测分支OPB和面向遮挡的非极大抑制OccNMS。BGAM模块使用目标框引导生成空间注意力特征图,来进行特征增强,提升行人的定位精度;OPB分支用于预测行人框的遮挡率(Occlusion Rate,OR),接着OccNMS根据的遮挡率的大小动态设置不同的抑制阈值,使得遮挡严重的行人预测框能够保留。我们分别在公开数据集和高铁站台数据集进行了行人检测实验。结果表明,相比于RepLoss、MGAN等行人检测算法,GARCNN的检测精度分别提高了0.6%和0.9%,在遮挡严重区域漏检率分别下降了1.1%和1.2%。
文本文从以上三个方面对行人检测展开了算法和实验研究。实验结果表明,本文提出的方法能有效提升密集行人检测的精度,同时,也降低了密集行人检测的漏检率,可以满足高铁站台场景、机场、广场等公共场所密集行人检测应用的要求。
本文主要研究工作如下:
(1)面向高铁站台场景的行人检测任务需求,构建了一个高铁站台密集行人数据集HUST。数据集中共有2637张图片,其中包含33473个行人目标,平均每张图片有12.7个行人。数据集收集自十余个高铁站台,且涵盖多种尺度、不同遮挡程度的密集行人场景。通过使用FasterRCNN、SSD和RetinaNet目标检测方法在数据集上进行实验,发现通用目标检测算法在密集行人检测上存在漏检问题。
(2)针对多尺度行人检测过程中,小尺度行人漏检率高的问题,提出了一种基于密集连接的多尺度特征金字塔网络(Densely Connected Feature Pyramid Network, DCFPN),利用密集连接的方式对不同尺度特征进行线性加权,融合深度语义信息和浅层纹理信息。同时基于行人宽高比相对稳定的特点,利用K-Means聚类算法估计行人的宽高比,进而设计适应行人检测的锚框,并分别在公开数据集和高铁站台数据集中进行行人检测实验,结果表明,与FPN相比,DCFPN的检测精度分别提高了1.1%和1.9%,漏检率分别下降了1.2%和1.4%。
(3)针对密集遮挡行人检测中行人定位不准、漏检率高的问题,提出了一种基于引导注意力机制的遮挡行人检测方法(Guided Attention RCNN,GA RCNN)。该方法包括目标框引导注意力模块BGAM、遮挡预测分支OPB和面向遮挡的非极大抑制OccNMS。BGAM模块使用目标框引导生成空间注意力特征图,来进行特征增强,提升行人的定位精度;OPB分支用于预测行人框的遮挡率(Occlusion Rate,OR),接着OccNMS根据的遮挡率的大小动态设置不同的抑制阈值,使得遮挡严重的行人预测框能够保留。我们分别在公开数据集和高铁站台数据集进行了行人检测实验。结果表明,相比于RepLoss、MGAN等行人检测算法,GARCNN的检测精度分别提高了0.6%和0.9%,在遮挡严重区域漏检率分别下降了1.1%和1.2%。
文本文从以上三个方面对行人检测展开了算法和实验研究。实验结果表明,本文提出的方法能有效提升密集行人检测的精度,同时,也降低了密集行人检测的漏检率,可以满足高铁站台场景、机场、广场等公共场所密集行人检测应用的要求。