【摘 要】
:
近年来,由于数据驱动的深度学习技术的突破,推动了自动驾驶技术在城市限定区域的落地应用。然而,出于安全性考虑,自动驾驶车辆往往采用优先礼让行人策略,这会使自动驾驶车辆在高密度的一般城市道路环境中停滞不前,造成交通拥堵。准确感知行人并预测行人的未来轨迹,是解决该问题的关键。本文重点关注自动驾驶环境感知方案中的行人检测、行人跟踪和行人轨迹预测问题,基于深度学习方法和视觉传感器,针对城市无信号控制路段的行
论文部分内容阅读
近年来,由于数据驱动的深度学习技术的突破,推动了自动驾驶技术在城市限定区域的落地应用。然而,出于安全性考虑,自动驾驶车辆往往采用优先礼让行人策略,这会使自动驾驶车辆在高密度的一般城市道路环境中停滞不前,造成交通拥堵。准确感知行人并预测行人的未来轨迹,是解决该问题的关键。本文重点关注自动驾驶环境感知方案中的行人检测、行人跟踪和行人轨迹预测问题,基于深度学习方法和视觉传感器,针对城市无信号控制路段的行人进行对象识别、位置获取以及轨迹预测研究,主要研究内容如下:(1)搭建了一种基于卷积神经网络的一阶段目标检测模型。当前的自动驾驶技术要求目标检测模型具备良好的光照变化鲁棒性和场景适应性。针对这一需求,以一阶段目标检测算法Yolov3为基础,构建行人检测模型。使用K-means算法对VOC2007数据集进行聚类,得到了 9个更具普适性的行人检测框尺寸,并在MS COCO数据集的基础上,添加了 INRIA Person数据集以扩充白天城市道路场景的行人样本,添加了ExDark数据集以扩充夜间城市道路场景的行人样本,最终训练得到的模型在CUHK square、CPCS、KITTI、ExDark和NightOwls测试集上对光照变化鲁棒,场景泛化性能良好,且具备较高的精度和实时性。(2)提出了一种引入全局注意力机制的行人跟踪模型。目前的TBD(Track by Detection)模式的多目标跟踪模型,因内部级联匹配效果不佳,导致跟踪过程中频繁发生目标ID切换。针对这一问题,提出将全局注意力机制引入级联匹配的表观特征提取过程。所提出的模型以SORT为基础架构,在表观特征提取网络ResNet50中加入Rga(全局注意力)模块以提升网络输出的表征能力。所提出模型在白天场景的自动驾驶数据集KITTI和夜间场景的自动驾驶数据集NightOwls上对光照变化鲁棒,场景泛化性和精度表现良好,并在MOT16基准上,较EAMIT、POI、SORT和DeepSORT四种方法,在ID切换次数等部分精度指标上取得了提升,且能够在单显卡上实现实时跟踪。(3)提出了一种状态信息共享的LSTM行人轨迹预测模型。原始LSTM单元结构仅基于待预测目标自身状态预测轨迹,导致预测结果无法体现行人轨迹的群体性和相互规避性。针对这一问题,提出一种状态信息共享的LSTM单元结构。所提出结构考虑待预测目标指定距离范围内的其他对象的状态信息,以状态信息加权和的形式加入LSTM内部长期记忆单元的构建过程。基于所提出的结构,设计了一种状态信息共享的LSTM轨迹预测模型,该模型在单显卡上能够实现实时轨迹预测,且在ETH和UCY基准上,较SF、IGP、LSTM和同样考虑了行人彼此间相互作用的Social-LSTM方法取得了最低的平均位移误差,并保持了较低的最终位移误差。(4)使用自采集的校园道路场景数据集验证了本文三个模型的性能。本文搭建的目标检测模型和提出的行人跟踪模型应对光照变化和场景变化的能力在自采集数据集上得到了进一步的验证。本文三个模型在实际的自动驾驶场景应用中均保持了较高的精度和实时性,能够满足自动驾驶领域行人检测、行人跟踪和行人轨迹预测任务的需求。
其他文献
目前机器人技术的发展日新月异,其智能化程度已经成为国家科技水平和综合国力的评价标准之一。其中,移动机器人能够代替人类在各种环境下从事复杂的重复性作业,在国防、星球探索、家庭服务等领域应用非常广泛。移动机器人要在未知环境下完成任务,就必须无碰撞的到达目标位置,因此路径规划是移动机器人最重要的一项基本能力。为了使移动机器人在未知环境下直接基于视觉信息自主学习最优动作,本文提出了一种端到端的路径规划算法
在印刷的过程中,印刷前会对数字连续调图像进行半色调处理,变换后的半色调图像具有与原图像相同的视觉效果,并且解决传统印刷无法实现连续调图像打印的难题,但却引入了半色调噪声,造成原图像一定程度的信息缺失。如果得到的是一张半色调图像,并想对其进行压缩、缩放、增强、识别等数字图像处理操作,则必须先对该图像进行逆半色调处理,恢复原图像缺失的部分信息。目前,数字图像逆半色调方法有很多,查找表法(LUT)逆半色
随着人们生活水平的提高,食品医药产品的质量越来越受到重视。产品包装的质量是食品医药产品质量可靠性的保障。产品包装密封性检测在包装设备上的应用极具前景。因此有价值探索高灵敏度、高可靠性的气体密封性检测方法。基于压电聚合物聚偏氟乙烯(PVDF)材料的气体传感器具有便于大批量制造、柔韧性好、性质稳定等优点,被认为是理想的气体传感器之一。但如何将该传感器用于包装泄露产生的微弱变化的检测成为其应用的难点。本
人体姿态估计广泛应用于人体动作识别,人体动作的检测和跟踪,体育运动分析,人机交互等方面。由于人体复杂的结构和人体部位的灵活性,姿态估计是计算机视觉领域的困难问题。姿态估计目的是检测人体的不同部位,估计关节的关键点的坐标。然而,传统算法类似基于HOG特征的人体关键点检测算法,往往检测准确率较低。本文主要研究了基于深度学习的人体关键点检测算法,采用ResNet101层网络实现了对静态帧图像人体关键点的
水下机器人尤其是自主水下机器人(Autonomous Underwater Vehicle,简称AUV)大量应用于遥控侦察、海洋测绘、水下打捞、管路巡查等领域,其需求量大、应用广泛,是目前各国竞相发展的重要技术装备。AUV螺旋桨是为其提供动力的关键零件。AUV螺旋桨具有几何形状复杂、加工精度和表面质量要求高、多品种少数量等特点,目前AUV螺旋桨多依赖于数控五轴联动加工,其设备成本和加工制造成本都很
当前,数控机床作为国家制造业的龙头,越来越受到国内各行各业的重视。其高智能、高自动化的加工方式,正在以飞快的速度改变着传统的低效机械加工方式。然而,现有的数控机床产品多属于车、铣、镗、磨等通用加工类型和数控加工中心,对于大型、高速的专用数控钻床,还难以满足市场的需求。所以基于此,迫切的需要一种新方式的孔加工设备来取代旧的传统的钻孔设备。本课题所研究的大型龙门移动式数控平面钻床正是一种采用全新孔加工
随着智能手机处理能力的不断提升,微型低功耗传感器的不断发展,基于传感器的行为识别已经成为一个热点研究领域。本文以使用手机的人群作为主要研究对象,研究手机使用过程中的不良行为识别方法,让智能手机在带给使用者智能化体验的同时,也使得手机使用的不良行为引起人们的重视。本文主要研究内容包括:第一,基于手机位置的不良行为识别方法。本文针对现实生活中静坐、行走、上楼梯、下楼梯、乘坐公交等场景的手机使用行为,并
随着深度学习网络规模的增大,导致网络训练参数数量快速增长及网络训练时间随之增加,卷积神经网络作为深度学习的一部分,虽然利用权值共享降低了部分参数的数量,但是参数数量依然庞大,网络训练耗时过长问题依然存在。针对这个问题,本文实现了分布式环境下的卷积神经网络,并提出基于二叉树的异步参数更新算法(B-APU)和基于时间因素的FIFO调度策略(FIFO-T)对分布式卷积神经网络进行优化。主要工作如下:(1
半喂入联合收割机在现有谷物联合收割机中有着广泛的应用,随着联合收割机的发展和研究,人们对脱粒性能要求越来越高,脱粒装置作为联合收割机的核心装置,决定了联合收割机的脱粒性能,研究谷物在脱粒装置中的运动规律及过程,对脱粒装置的优化有着重要的作用。本文以半喂入联合收割机久保田PRO 588为基础,对脱粒装置的理论分析研究、结构及性能仿真试验研究和对关键零部件的结构优化,具体工作如下:首先,对现有联合收割
随着人类社会的迅速发展,有害气体带来的环境问题日益严峻。利用高性能气敏传感器对有害气体进行快速高效的监测是解决该类环境污染的前提。在众多的半导体金属氧化物中,由于ZnO制备工艺成熟简单,具有高的电子迁移率和良好的物理化学性能而受到了广泛关注。然而,目前商业化的ZnO气敏传感器存在着工作温度高、灵敏度低、选择性较差等方面的不足,通过改善形貌、掺杂改性、形成P-N结等是提高ZnO气敏材料灵敏度和选择性