铁路视频监控中小尺度行人检测算法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:leng36318
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
铁路运输兼顾货运和客运,是关乎国计民生的运输大动脉。现阶段铁路运输仍无法做到全封闭运行,因铁路基础防护设施薄弱而导致的铁路交通事故时有发生。其中,行人入侵是影响铁路行车安全最为重要的因素之一,实现铁路关键区域实时行人检测与报警将为列车行车安全提供保障。目前,短焦距摄像机广泛应用于铁路场景监控,为有效解决大视场下小尺度行人检测精度低而引起的高漏报率、高误报率等问题,本文展开基于深度学习的铁路场景小尺度行人检测算法研究。论文主要完成工作如下:(1)针对铁路场景小尺度行人检测精度低的问题,提出了一种基于注意力和多级特征融合的小尺度行人检测算法。基于YOLOv3设计行人检测基础网络,结合小尺度行人特性从多尺度预测、注意力机制引导下的特征融合以及损失函数优化三方面实现网络的改进与优化。实验结果表明该算法相较于改进前基础网络具有更高的检测精度,在铁路场景数据集对数平均漏检率由25.2474%降至9.1843%。(2)为充分利用小尺度行人的视频帧间运动信息,提出了一种结合运动信息的视频小尺度行人检测算法。将连续帧作为网络输入,引入三维卷积学习提取帧间行人运动信息,同时结合自适应特征融合模块实现行人空间位置信息和运动信息自适应聚合。在铁路场景数据集测试结果表明,该算法将对数平均漏检率由9.1843%进一步降至6.8919%,有效改善了存在部分遮挡、受复杂背景干扰等情况下小尺度行人的错误检测问题。(3)为进一步降低小尺度行人漏检率,设计了一种结合多目标跟踪的视频小尺度行人检测算法。将DeepSORT多目标跟踪算法作为检测网络的后处理,实现轨迹上漏检行人的再补充。实际铁路场景测试结果表明,该算法有效提高了对于小尺度行人的检测精度,将对数平均漏检率降至5.3527%。(4)针对卷积神经网络参数量多、运算量大的问题,对网络结构进行轻量化,设计了一种轻量级特征提取网络。利用深度可分离卷积替代常规卷积减少网络的参数量、运算量,同时引入倒残差结构提高模型的特征提取能力。实际铁路场景测试结果表明,该网络在保证检测精度的前提下将模型大小由248.4MB压缩至110.9MB,加快了算法运行速度。本文致力于提升铁路场景小尺度行人检测精度,从单帧输入、连续帧输入、后处理以及轻量化四个方面对网络进行优化设计,经测试本文算法有效降低了小尺度行人的漏报率、误报率,具有良好的发展前景和实际应用价值。
其他文献
学位
人体姿态估计是指在图像/视频中检测定位人体的关键点位置,并以此估计人体姿态的过程,作为人体行为理解的重要支撑技术,具有重要的研究意义与广泛的应用价值。在复杂多变的现实场景中,遮挡、相机角度和多尺度等因素严重影响人体姿态估计算法的性能,因此对自由度较高的人体进行姿态估计仍面临很多挑战。本文面向现实复杂场景,基于深度学习和注意力机制,研究了如何充分利用深度特征提高人体姿态估计模型的性能。本文的主要工作
日益复杂的电磁环境对人类生产生活产生影响,电磁屏蔽技术是切断耦合途径的有效措施,屏蔽技术的应用离不开对屏蔽材料的研究与设计。屏蔽材料的屏蔽效能测量是研究工作的基础,为分析材料特性提供数据。首先,本文从屏蔽效能测量方法展开研究,阐明屏蔽室窗口法和法兰同轴法两种测量方法的原理和步骤,以及分别适用的场源类型,测量频段,材料类型等属性。为提高测量效率与精度,基于屏蔽室法搭建了屏蔽效能自动测量系统,采用GP
现如今,导体和半导体的加工技术已经十分成熟,但非导体的加工仍在探索之中。非导体陶瓷材料广泛应用于航空航天、国防、生物芯片等重要领域。例如航空发电机涡轮叶片热障涂层的气膜孔、微流控芯片的应用、石英谐振器和生物芯片等应用。但该材料具有熔点高、硬脆的特性,因此不易于加工。放电辅助化学加工(Spark Assisted Chemical Engraving,SACE)是一种适合加工非导体材料的加工方式。该
随着分布式直流微电网的发展,储能系统的重要性越发凸显,作为连接微电网直流母线与储能系统的关键环节,提高双向DC-DC变换器的效率具有重要的研究意义。本文在直流微电网低压储能系统的应用背景下,提出了基于双向零电流开关(Zero Current Switching,ZCS)的分布式储能变换器,具有良好的软开关特性,可以在双向运行时保持低压大电流一侧的零电流开关特性,从而降低双向运行下的开关损耗,提高变
水体中氮素含量过高会危害生态环境和人体健康,厌氧氨氧化反应(anaerobic ammonium oxidation,Anammox)因无需外加碳源、动力消耗低和剩余污泥量少对处理高浓度氨氮和低碳氮比的污水来说更加经济高效和环境友好。参与反应的厌氧氨氧化菌(anaerobic ammonium-oxidizing bacteria,An AOB)倍增时间长,对生存环境要求苛刻,常采用填料进行富集,
伴随着经济的高速增长以及整个金融行业信息化浪潮的到来,证券业务也随之进入“大数据”时代,证券行业逐渐成为一种高智力,高收益,高科技的行业。然而,随着全球化经济的不断渗透,证券市场因国际资本的流动而显得变幻莫测,证券行业中的各类风险也随之变得复杂和难以把控,因此怎样去分析并预测风险成为证券公司将要去攻克的一个难题,而市场风险是证券公司所面临的重要风险之一,并且在市场风险领域进行把控对证券公司而言有着
人体姿态估计是计算机视觉中一项基础且关键的技术,是研究的热点。人体姿态估计在关键点定位、虚拟现实、自动驾驶、视频监控、运动分析、人机交互和3D目标识别等很多方面有着广泛的应用。目前,随着人工智能技术的发展,国内外学者们提出了大量的基于深度学习的人体姿态估计算法,取得了显著的成果。但是真实场景复杂多变,现有的人体姿态估计算法仍难以满足实际应用的需求,复杂场景中的严重遮挡、低照度等实际问题极大影响了人
新型建筑工业化背景下,建筑进入智能建造时代;但部品接口问题却日益突出,具体表现为部品接口安装过程中,由于类型繁多、存在尺寸偏差使建筑的建造质量和效率无法得到根本改善,严重制约建筑工业化的发展。因此,本文重点研究如何解决部品接口安装质量与安装效率的问题,以适应新型建筑工业化下,建筑个性化定制和高效高质量发展的需求。本文从构成秩序视角出发,以智能建造理论为基础,立足事物发展本质,对部品接口技术体系进行
教材分析:四边形内角和是人教版修订教材增加的内容,让学生解决"四边形的内角和是多少度"的问题。这一内容以往是放在初中教学的,现下移到小学阶段,纵观三个学段的教材:早在一年级下册,学生认识了长方形、正方形、平行四边形、三角形和圆5种平面图形,能够在众多的平面图形中辨认出这些图形。四年级下册对三角形的学习经历了三角形的初步认知——三角形的三边关系——三角形的分类——三角形的内角和——四边形内角和
期刊