基于深度学习的车辆行人检测系统

来源 :科学与技术 | 被引量 : 0次 | 上传用户:liugang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:车辆行人检测是利用计算机视觉技术判断图像或者视频序列中是否存在行人或车辆并给予精确定位的一种目标检测技术。行人检测技术是行人跟踪、行人识别等技术的基础与前提,它在自动驾驶、智能监控、智慧城市、无人零售等领域具有重要的作用。由于行人兼具刚性和柔性物体的特征,外观易受穿着、遮挡、姿态、尺度和视角等因素的影响,因此行人检测一直是计算机视觉领域中一个既具有研究价值又极具挑战性的课题。本项目旨在对车辆行人检测算法进行研究,使用深度学习方法实现车辆行人检测算法,并使用公开数据集对神经网络模型进行训练,实现车辆行人检测技术,完成对图像与视频序列中的车辆行人进行目标检测的任务。
  关键词:深度学习;卷积神经网络;车辆行人检测
  一、车辆行人检测的背景和意义
  1.行人检测
  行人检测就是计算机对于给定的图像和视频,判断出其中是否有行人及行人的位置,是行人跟踪、身份识别、行人行为分析等的基础。在自动驾驶领域,行人检测是感知模块的重要组成部分,它为汽车的决策系统提供信息;在智能监控方面,行人检测配合行人跟踪技术,能够对行人的行走路径进行跟踪;在智慧城市领域,行人检测技术能够对交通违法行为进行辅助判别;在无人零售领域,行人检测配合人脸识别技术对顾客的购物提供帮助。
  2.车辆检测
  近年来,随着无人驾驶技术、计算机视觉技术的不断发展,智能交通作为一种新兴交通理念应运而生并逐渐流行起来。对自然场景下的车辆及行人定位系统可以比作是无人驾驶技术的“眼睛”,是智能交通和无人驾驶的重要组成部分。然而很多传统的目标检测算法都是基于手工设计的特征和小训练样本的,往往受到光照、遮挡、环境变化等众多因素的影响,进而影响了目标检测算法的性能。基于深度学习的目标检测系统以极大的优势超越了传统视觉算法,通过在大数据下自主学习得到的特征,在数量以及性能上都远远超出了人手工设计的算法特征。
  二、项目主要研究内容
  1.深度学习目标检测算法的选择
  在对比了深度学习目标检测算法中主流的2-stage算法与1-stage算法以及它们各自的优缺点后,最终,考虑到车辆行人检测对实时性的较高要求,在保证一定的准确率的情况下,该系统使用了1-stage算法中的YOLOv3卷积神经网络,将车辆行人检测任务看作分类与回归问题,使用一个端到端的卷积神经网络来实现车辆行人检测,相比2-stage算法具有较高的速度,同时仍保持着良好的精度,非常适合应用于工程领域。
  2. YOLOv3卷积神经网络算法的应用
  为了对神经网络进行训练,使用公开数据集KITTI自动驾驶场景数据集来对神经网络模型进行训练,特别地,针对道路上经常存在的车辆与行人、车辆与车辆、行人与行人之间相互遮挡的问题,结合Oxford RobotCar、INRIA等公开数据集,搜寻并手动标记了500张具有遮挡情况的图像,使用这些图像来对神经网络进行训练,以提升对遮挡物体的目标检测效果。
  为了达到出色的检测效果,该系统借鉴了深度学习中另一个目标检测算法Faster R-CNN的思路。简单来说,R-CNN算法与传统用于分类的CNN算法的区别在于R-CNN先提取目标区域,然后对目标区域提取特征进行分类,而传统分类任务是对整体目标区域提取特征进行分类。
  在该项目中,首先生成先验的候选区域,作为神经网络对车辆行人位置的初始预测。为了生成先验的候选区域,需要确定先验候选区域的尺寸和宽高比。应用了机器学习中的K-means聚类算法,得出了适合于车辆与行人检测的候选区域的尺寸和宽高比,之后对数据集中的边界框的宽高信息进行聚类,计算出适合于车辆行人检测的先验候选区域的9种尺寸与宽高比。
  该系统中将整个卷积神经网络分为两大部分,第一部分是特征提取网络,负责对输入的图像进行特征提取,得到多种尺寸的特征图;第二部分是检测网络,它以特征提取网络产生的特征图作为输入,通过对特征图做进一步的卷积运算,分析每个候选区域中包含物体的概率,并输出边界框回归系数来对候选区域的位置进行最后的调整。
  在特征提取階段,特征提取网络以原始图像作为输入,通过卷积等运算来提取图像的特征。为了达到出色的效果,在过程中采用了DarkNet-53卷积神经网络作为特征提取网络的主干部分。DarkNet-53具有非常明显的优点:首先,它的网络具有53层,是深度较深的网络,而网络的深度越深,越能提取到图像更加丰富的特征,越有利于对图像内容的分析。第二,它在每一个卷积层之后都加入了批标准化网络层以及LeakyReLU激活层,可以避免梯度爆炸、梯度消失等问题的出现;第三,它借鉴了深度学习中先进的残差网络结构,既可以避免梯度爆炸、梯度消失等问题的出现,又增强了模型的非线性表达能力。
  对于每个候选区域,设计检测网络,让其输出一个7维的向量,一个向量中的7个值分别代表:候选区域包含物体的概率(置信度),候选区域中的物体是车辆的概率,候选区域中的物体是行人的概率,以及4个用于修正候选区域位置的边界框回归系数。检测网络会考察每个候选区域包含物体的概率,概率低于0.7则舍弃该候选区域。对于包含物体的概率大于0.7的候选区域,如果它是车辆的概率更高,则将它判断为车辆,否则判断为行人。接下来,使用4个边界框回归系数来对候选区域的位置进行修正,反向传播误差以训练和优化神经网络。
  在得到位置修正后的候选区域后,对它们应用非极大值抑制算法,保留对每个物体的预测效果最好的边界框,对“一个行人目标,多个候选区域”的情况进行处理,减少输出结果的冗余,提高精度。
  为了对网络进行训练,结合检测网络输出的7维向量的内容:置信度、类别概率以及位置信息,采用这三种内容的损失的联合函数来对网络进行训练。联合损失函数是置信度损失、类别概率损失与位置信息损失的加权和,这样,在训练过程中可以兼顾判断候选区域是否包含物体的训练、判断候选区域内包含哪种类别的物体的训练以及修正先验候选区域位置的训练。   通过对车辆行人检测的需求分析与调研,发现车辆行人检测的应用形式主要有三种:检测图像中的车辆与行人,检测视频序列中的车辆与行人,以及调用摄像头捕捉影像,实时检测车辆与行人。因此针对这三种应用形式,设计了具有这三种功能的前端界面,实现了对输入图像进行检测、输入视频进行检测以及开启摄像头进行检测这三种功能。
  三、项目设计重点与难点
  1.遮挡情况的物体检测。
  遮挡情况是目标检测中较为棘手的一个问题,针对遮挡情况,该系统从KITTI、Oxford RobotCar、INRIA等公开数据集中搜寻并手动标记了500张具有遮挡情况的图像,使用这些图像来对神经网络进行训练,以提升对遮挡物体的目标检测效果。
  2.特征提取网络的设计。
  特征提取网络在整个卷积神经网络中扮演着至关重要的角色,它的性能决定了提取出的图像特征的优劣,同时,它也是容易发生梯度消失、梯度爆炸、过拟合等问题的部分。该系统中选择DarkNet-53卷积神经网络,它具有较深的网络结构,可以很好地提取图像的特征;同时深度也不算太深,现有的显卡等设备可以胜任训练它的任务;它采用了批标准化和Leaky ReLU激活函数,可以解决梯度消失、梯度爆炸等问题的出现;同时采用深度学习神经网络中先进的残差块结构,可以有效地解决在深度较深的情况下容易发生的过拟合问题。
  3.损失函数的设计。
  检测网络部分需要输出三种内容:置信度、类别概率以及位置信息。这三个内容都需要通过良好的训练来达到较好的效果,而one-stage算法中的代表性网络YOLOv3的优势在于可以端到端的训练,在保证精度的情况下显著提升速度,因此在训练过程中使用了这三种损失的一个联合损失,可以同时对这三种内容进行训练。
  四、总结与展望
  行人检测技术作为计算机视觉领域的重要问题与热门问题,是推动自动驾驶、智能监控、场景理解等应用领域发展的基础与前提。本文介绍了该基于深度学习的车辆行人检测系统的研究背景与意义、主要研究内容和研究过程中的重点与难点问题,从YOLOv3卷积神经网络算法入手,结合了深度学习在计算机视觉方面的一些研究成果,利用深度学习网络作为特征提取方法。虽然本文中该系统的检测方法已远优于传统的车辆行人检测算法,但其实施过程中仍存在不足与需要改进之处,如当前使用的GPU算力不足,导致算法运行效果欠佳、算法对重叠行人的识别不够准确,需改进算法,或扩充训练集等。
  参考文献
  [1].宋欢欢、惠飞、景首才、郭兰英、马峻岩.改进的 RetinaNet 模型的车辆目 标检测.计算机工程与应用[J].
  [2].张汇、杜煜、寧淑荣、张永华、杨硕、杜晨.基于 Faster RCNN 的行人检 测方法.传感器与微系统[J].
  [3].王彬.基于深度学习的行人检测.北京交通大学
  [4].杨志恒.基于深度学习的车载实时行人检测研究.数码世界[J].
  (作者单位:哈尔滨工程大学)
其他文献
摘要:随着科技的发展,洗衣机的种类越来越多,但是曾经有一款真空洗衣机曾被研究出来,但却未面市。本文将对真空洗衣机的洗涤原理以及做出探究,对真空洗衣机提出一些建议。  关键词:多功能;真空洗衣机;应用  真空洗衣机是俄罗斯所研制出的一款概念洗衣机,想法非常好,但是由于技术尚未成熟,并未研发上市。此外,海尔也曾推出过一款所谓的臭氧型不加洗衣液的洗衣机,推出已十几年,但到现在还尚未普及。  一、真空洗衣
期刊
CK6150数控机床是一种较为常见的通用型数控机床,在制造业企业中应用较为广泛。但是,在日常使用中,CK6150使用会出现故障,由于系统较为复杂,加之数控系统自诊功能无法对机床内的所有部件进行测试,往往出现一个报警信号出现多个故障,使维修人员无法快速、准确地找到故障所在。在此情况下,作为一名维修工,我就华中数控CK6150数控机床维修提出自己的看法:  一、现场故障的诊断与分析  目前,数控机床往
期刊
摘要:近几年,随着我国电气设备的发展与进步,致使电气自动化设备被广泛的应用到各个领域中,并满足了日常生活、工作需求。电气自动化控制设备的可靠性一直是我国人民群众关注的问题,逐渐成为焦点问题。此外,电气自动化设备控制可靠性直接关系到人民群众的生命安全,企业应注重提升其设备的工作安全性能,并合理的优化电气自动化控制设备的可靠性,提高电气自动化控制设备的性能。。  关键词:电气自动化;设备可靠性;问题 
期刊
摘要:在我国社会经济的快速发展下,我国的科学技术得到了进一步的发展,智能化建筑不断增多,逐渐成为现代化城市的标志,而电气自动化技术在智能建筑中的应用具有非常重要的地位,能够有效提高智能建筑建设的质量,为后续建设奠定基础。本文就对电气自动化智能建筑设备安装和质量控制要点进行分析,从中更了解其发展的重点。  关键词:电气自动化;智能建筑;设备安装;质量控制  引言  随着我国经济社会的不断发展,智能建
期刊
摘要:随着我国煤炭开采以及煤炭企业的不断发展,煤炭机电设备被广泛应用,这些设备在煤炭开采以及安全保障上起到了重要的作用。为保证煤矿正常运转和安全运转而进行的设备维修成为了煤矿企业的必须工作。本文就煤矿机电设备维修管理的模式进行了简要的讨论,并提出了其发展的趋势。  关键词:设备维修;发展趋势;安全保障  我国煤矿在近年来不断引进各种机电设备用于进行生产以及保障生产安全,这些机电设备不仅提升了我国煤
期刊
摘要:我国社会在近年来的发展中一直提倡科技创新发展战略,也是我国现代经济发展的大趋势。各行各业现在目前都在进行科技创新,工业机械设计制作及其自动化也是科技创新中的一个重要方面。为了加强机械制造及其自动化的不断发展,国家政府也根据实际情况出台了一系列政策及制度。  关键词:机械设计制造;自动化;策略  我国生产企业发展中的重要组成要素之一有机械设计制造,这对企业产品的生产及企业稳定发展有着一定的积极
期刊
摘要:建筑行业是促进国民经济发展的支柱产业,近年来我国建筑行业发展迅猛,需要更高水平的施工管理。本文分析了优化施工技术管理的意义,并总结了存在的问题和解决措施。  关键词:建筑施工;技术管理;问题与对策  引言  进入新时期以来,我国经济高速发展,建筑行业发展也取得了优异成绩,市场竞争愈加激烈。为了提高建筑工程质量,完善的施工管理是必不可少的,作为对施工质量影响比较明显的施工技术,加强管理更是不容
期刊
摘要:依托四平市东丰路上跨铁路立交桥工程,对非对称独塔斜拉桥结构形式的索鞍拉索体系施工方法进行研究,在结构稳定性、耐久性、安全性、适应性等方面具有研究和推广价值。本文重点介绍,GT型带索鞍拉索结构体系的工艺原理、施工工序、工艺要点,质量控制措施,为该类型索-塔锚固结构在其他项目施工过程中提供一些建议。  关键词:非对称混合梁;斜拉桥;GT型带索鞍;拉索锚固体系  引言  随着科学技术的日益进步,我
期刊
摘要:本文主要对当前建筑电气工程施工中的质量控制与安全管理工作进行了分析,重点对如何进行质量控制和安全管理的措施进行了总结。随着城市化进程的不断发展,建筑电气工程施工中的质量控制与安全管理工作逐渐的受到更多人的关注,所以施工单位也一定要根据建筑电气工程的实际情况来进行有效的管理和控制,提高质量与安全性,为建筑电气行业提供更有力的保证。  关键词:建筑电气工程;质量;安全  1 建筑电气工程施工中的
期刊
摘要:随着科学技术水平的逐渐提高,信息技术的广泛运用,纺织机械的各种自动控制技术也得到了不断的发展与推广。在纺织机械制造行业规模不断扩大的形势下,生产的产品种类越来越多,其信息化技术水平与自动化技术水平也得到了相应的提高,自动化产品也越来越多。本文主要对纺织机械自动控制技术进行分析,促進纺织机械生产效率的进一步提高。在历史发展过程中,纺织技术进行了两次重大变革,手工机械和大工业化。纵观纺织技术的发
期刊