密集场景行人检测算法研究

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:huanyou123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前行人检测技术已经被广泛应用在生活中的各种场景,其目的为对视频或图像中的行人进行分类与定位任务。但由于应用场景中干扰因素较多:主要为环境因素与人为因素。环境因素:跨场景的差异性,视频监控设备的水平高度与安装角度差异问题,白昼与黑夜的光线问题,天气的变化等因素。人为因素:行人的聚集特性,行人的外形差异。以上这些因素都是导致行人检测算法表现不佳的原因,而最突出的问题还是行人的聚集特性,伴随着行人的密集场景,这其中的突出问题便是遮挡问题,其次是小目标检测问题。因此,本文的重点研究方向便是解决由于遮挡问题导致的行人检测算法表现不佳的现象,同时也对小目标的行人检测在特征提取上做出了优化。本文将行人检测中的遮挡问题分为了类间遮挡与类内遮挡。本文的主要研究内容由以下5部分所组成。前四部分为针对遮挡问题做出的针对性优化设计,第五部分为针对小目标检测做出的优化设计。1.多分支模型与显式学习策略处理类间遮挡问题。本文针对类间遮挡提出了多分支模型与显式学习策略相结合的方法。显式学习策略可以使用行人的可见部分标注来指导模型的学习过程,使其更加关注行人的可见部分特征,可以较好地处理类间遮挡的特征缺失问题。多分支模型相较于单分支模型,具有额外的分支,该分支可以采用额外的显式学习策略,在仅增加一个较小计算量的FCN分支网络的情况下,有效地处理了类间遮挡问题。2.多分支模型与多实例预测机制处理类内遮挡问题。本文针对类内遮挡采用了多分支模型与多实例预测机制相结合的方法。单分支模型因为其仅具有一个预测分支,所以只能实现单实例预测,即一个候选框对应一个行人。而多分支模型具有多个检测头,一个候选框可以生成多组检测结果,在类内遮挡的情况下,多实例预测可以有效的改善漏检情况。3.soft-NMS算法处理遮挡情况下的漏检问题。本文针对贪婪性质的非极大值抑制算法,往往会导致模型召回率较低的问题,使用弹性非极大值抑制方法来代替它。在召回率上取得了提升,在平均精度上同样取得了一定的改善。4.引导性数据增强方法解决遮挡样本较少与缺少针对遮挡问题的数据增强方法问题。本文针对目前行人数据集中遮挡样本数量较少与缺少针对遮挡问题的数据增强方法,设计了具有良好引导性的数据增强方法,在训练时将行人的标注框分为头部,左躯干,右躯干,左下肢,右下肢共五个部分,随机选取一个部分使用灰色像素块进行污染,增加了数据集中的被遮挡行人实例的数量。5.使用特征融合与并行结构骨干网络解决小目标检测问题。本文针对模型的骨干网络,提出了优化方法,采用了具有并型结构与大量多尺度特征融合的HRNet来替换Faster-RCNN原有的VGG16网络,在平均精度与丢失率上均达到了更好的效果。基于上述5项改进之处,本文设计了多组对比实验,在公开的基准行人数据集Caltech,City Persons,Crowd Human,以及在中国各个地铁站所采集标注而成的地铁行人数据集上。在上述四个数据集中,本文所设计的方法,在上述数据集中的丢失率上取得了下降,在平均精度上取得了较好的改善,验证了本文设计的有效性。
其他文献
北斗二号卫星导航系统(BD2)作为我国“三步走”战略的关键一步,经过8年艰苦卓绝的建设,于2012年12月27日成功开通运行,为亚太地区的用户提供区域导航、定位、授时服务。星载原子钟作为卫星导航系统的关键设备,为卫星提供高精度的时间基准。随着BD2平稳精准地运行了近十年时间,部分在轨卫星已达到或接近设计寿命。对进入寿命末期的卫星开展相应的研究,是一项具有理论意义和实用价值的研究课题,同时对于掌握B
无机闪烁体探测器目前被广泛运用于医疗诊断、安全检查、高能物理等领域。无机闪烁体具有高密度、高光产额、高透过率等优良的闪烁性能,以及稳定的物化特性,与光电探测器耦合成为高能物理核物理实验中的核心探测器之一。近些年来,掺杂Ce3+的硅酸钇镥(LYSO:Ce)和钆镓铝石榴石(GAGG:Ce)在核探测领域中引起了广泛关注。LYSO:Ce光产额很高可达到30000 ph/Me V,其衰减时间很快(<40 n
随着我国城市化发展,城市中高楼大厦巍然耸立,各种宏伟建筑纷纷呈现在大众面前,由此也带动了建材业的快速发展。而建材质量决定了建筑安全问题,目前工程质量问题屡见报端,引发建材行业质量安全受到了广泛的关注,因此,建立有效的建材质量追溯管理系统,构建完整的建材生产到使用全链条监管体系,是解决建材质量安全问题的重要途径。本文从原材料生产加工到使用全流程的质量追溯管理机制为研究对象,以供应链管理理论、产业组织
氟化铝添加量和出铝量作为影响铝电解过程热平衡和物料平衡的两个非常关键性指标,对其取值的准确与否将直接影响到实际生产能否安全、稳定、高效地运行。因此,研究一种准确有效地获得氟化铝添加量和出铝量的决策值的方法具有重要的研究价值。而目前虽然电解铝生产自动化水平已经取得了较大的进步,但一些关键参数设置对生产管理人员的经验依赖度仍然较高,生产效益较容易受到主观因素的影响,因此,利用数据挖掘技术依据历史数据对
在日常生活中,文本错误随处可见,主要的文本错误分为两种,一种是同音字错误,另一种的同型字错误。文本错误的出现会导致网页存在别字影响用户阅读、音频识别不准确等问题,如何对错误文本进行合理纠错是一个亟待解决的重要课题。目前的现有技术中,基于统计的纠错方法最为成熟,如黑马校对系统,但是随着深度学习技术的发展,基于深度学习的纠错方法也在如雨后春笋一般逐渐涌出,科大讯飞与哈工大合作开发的校对系统就是其中之一
电驱重构型车载变流器是电动汽车车载电力电子系统的一种,其将电动汽车的驱动系统和充电系统的硬件整合为一体。该系统在保留电动汽车驱动系统固有的驱动功能情况下,以车载的驱动电机代替充电变流器的交流侧电感,达到减小充电系统体积,实现变流器车载的功能。本文提出了一种新型的电驱重构型车载变流器电路拓扑,该变流器与其他具有驱动系统和充电系统复用特性的变流器相比具有结构简单,成本低,能量可以双向流动以及能由现有电
航空发动机叶片类零件是军用和民用航空发动机中的重要零部件,其形状复杂,损伤后只能送往国外维修,存在维修周期长,成本高等问题。因此加快攻关航空发动机叶片类零件修复工艺中的感知、测量、修复、磨抛等关键技术研发,对我国航空事业的发展具有重大意义。基于3D视觉技术的叶片类零件三维重建和缺陷检测,是航空发动机叶片类零件修复及磨抛机器人系统中的关键工艺和首要环节,叶片类零件的三维重建精度、速度、缺陷识别准确率
新疆传统聚落是新疆留下的珍贵遗产,是该地区多民族文化的源头和物质空间根基,承载着珍贵的历史信息,具有很高的保护和发展利用价值。而新疆天山北麓作为新疆地区人口和经济的中心地带,坐落着众多极具代表性和研究价值的传统聚落。自新疆解放后,新疆天山北麓传统聚落迎来重大机遇和发展,一改以往落后贫穷的样貌,逐渐走上自给自足的脱贫之路。改革开放后,新疆天山北麓各传统聚落进一步发展,个别聚落被评为中国传统聚落和中国
机动性能对于移动机器人的应用往往具有关键意义,但现有的移动机器人机动性量化方法较为粗略。本文面向传统轮式移动机器人的机动性,提出了基于瞬时旋转中心的分布进行量化分析的方法,并在此基础上设计并实现了一款全轮转向轮式移动机器人实验平台。具体研究工作和结论如下:(1)对轮式移动机器人机动性定量描述的一般方法进行了分析,指出机动性除了与轮子配置相关外,与瞬时旋转中心分布范围、瞬时旋转中心位置切换快慢的能力
生物传感技术是当今社会的前沿科学技术,是集电子、生物、医疗、化学、物理、材料等多学科于一体的交叉综合性学科。生物传感器在环境监测、医疗健康、食品安全等各个领域都得到了高度重视及广泛应用。氮化镓的宽带隙和强化学硬度确保在高温、酸、碱等恶劣环境中可以稳定存在;同时AlGaN/GaN异质结通过极化效应形成高浓度、高迁移率的二维电子气(2DEG),2DEG的浓度对AlGaN/GaN异质结表面异常敏感,这种