基于深度强化学习的野外场景下目标跟踪关键技术研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户：weizai111

【摘要】

：

【作者】

：

郑圣杰

【机构】

：

南京理工大学

【出处】

：

南京理工大学

【发表日期】

：

2020年01期

【关键词】

：

目标跟踪深度强化学习野外恶劣环境

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

目标跟踪任务作为计算机视觉领域中最具挑战性的课题之一,被科研人员不断地进行研究和优化。该任务的主要目的是在一个给定的视频序列中,标出待跟踪目标在第一帧图像中的位置和大小。本文的研究工作和提出的创新点如下:首先,本文提出了一种基于双延迟深度决策的深度强化学习模型用于单目标跟踪,其采用双延迟深度决策算法以进一步优化Actor-Critic模型。我们使用两个Critic网络联合预测边界框置信度,获取其中较小的预测值作为标签,然后对网络参数进行更新,加速损失函数的收敛得到最准确的结果。通过在基准测试库OTB-2013、OTB-2015和VOT2016上进行综合实验,结果表明本文所提算法在精度、鲁棒性和实时性等方面有着优越的表现。由于基准测试库OTB和OVT都缺乏野外环境下的数据,本文又提出野外恶劣环境情况下的相关数据集。然而,将双延迟深度决策的目标跟踪算法测试该类数据集,结果具有高准确率、低重叠率的特点。我们针对这个问题对双延迟深度决策算法进行改进,将原始边界框、放大尺寸后的边界框和缩小尺寸后的边界框同时输入到Actor模型得到三个移动后目标边界框,将这三个新边界框内的图像与上一帧目标边界框内的图像进行匹配以获取最佳的边界框。我们所提出的算法能够很好地解决尺寸突变、尺寸变化大的情形,有效地提高了算法的鲁棒性。最后,本文设计并实现了目标跟踪系统,利用该系统可以进行实时的跟踪目标,其中目标由用户交互式选择。在跟踪结束后,系统会展示出跟踪过程中的精确度和重叠率。

其他文献

多机器人系统的智能任务分配方法

机器人对于人类生活和工作的革新有很大帮助,多机器人系统更是未来机器人的发展方向,对于制造业、加工业、危险环境和未知环境等都有很重要的意义。多机器人系统任务分配即为机器人和任务间寻求一种良好的对应关系,对于多机器人系统的执行效率至关重要,决定着多机器人系统完成任务的时间和资源消耗等多种因素。通常多机器人系统具有并行、冲突、可选方案多等特点,因此如何合理地分配系统内机器人在何时使用何种资源执行何种任务

学位

多机器人系统任务分配E-cargo模型时间Petri网匈牙利算法启发式A*搜索算法二元决策图

基于图像/自然语言融合的机器人肖像绘制技术研究

本课题以人脸图像为主要研究对象,将人脸图像转换为具有艺术家绘制风格的肖像素描画,并将得到的肖像画通过处理、计算得到可供机械臂绘制的坐标序列。具体内容如下:（1）研究了语义分割的发展现状,利用双边分割网络Bise Net作为分割的基础网络,并针对它网络较浅、上采样方式粗暴等缺陷对其进行了一系列改进,主要有:在空间路径中加入残差模块以增加空间路径的深度,重新构造了上下文路径使其更充分地利用不同尺度的特

学位

语义分割风格迁移图像生成

安全区域下跟随机器人的研究

跟随机器人需要在自主跟随的同时避开环境中的障碍物,安全区域特指环境中可以自由通行的无障碍区域。为解决跟随机器人在户外环境下的目标定位和自主跟随问题,本文在以下几个方面开展工作:首先对跟随机器人进行软硬件设计,设计了可在户外工作的履带式底盘,该底盘采用双流传动机构,具有转弯半径小、功耗低、控制简单的特点,提高了跟随机器人的机动性和环境适应性。机器人采用UWB和单线激光雷达融合的传感器方案。基于UWB

学位

跟随机器人超宽带定位激光雷达双流驱动动态窗口ROS

基于深度学习的复杂产品费用预测及软件业务系统状态预测

预测在现实生活中有着重要的意义,预测的目的在于通过对未来进行合理地判断和规划使得事情往有利的方向发展。深度学习作为一种科学有效的预测方法,被广泛应用到预测领域中,并取得了良好的效果。因此,本文基于深度学习模型中的生成对抗网络,研究了其在复杂产品费用预测和软件业务系统状态预测领域的应用:（1）传统的深度学习模型需要大量的数据对神经网络进行训练以此保证预测结果具有较好的准确性。然而,由于复杂产品本身的

学位

深度学习生成对抗网络费用预测卷积神经网络时序数据预测LSTM

基于深度卷积神经网络的蛋白质接触图预测研究

蛋白质结构信息在生物学、医学、药物学等多个领域都起到重要的作用。然而使用生物学实验来的得到结构耗时且昂贵,远不足以解析自然界中存在的巨大数量的蛋白质。所以基于序列的蛋白质结构从头预测具有巨大的理论价值和现实价值。蛋白质残基接触图是蛋白质空间结构的一种低秩表示。它约束着氨基酸间的距离,因此对重构蛋白质结构至关重要。作为一个分类问题,蛋白质接触预测存在一定特殊性:包括蛋白质接触的阈值是人为规定、蛋白质

学位

蛋白质接触图预测深度卷积神经网络同源信息单序列信息

小基站网络中基于深度强化学习的无线缓存技术研究

近年来,随着智能移动设备的迅猛增加和网络多媒体应用的快速发展,移动用户对无线网络数据的需求呈爆炸式增长,加剧网络传输压力。基于小基站网络的移动边缘计算和无线缓存技术利用小基站的计算和存储能力,将流行的多媒体信息缓存在网络边缘端,有效降低数据冗余传输,提高内容下载速度和无线网络的传输效率,从而提升用户体验。本文面向小基站网络架构,设计了三种动态缓存内容更新算法,以提高小基站缓存命中率,降低主干网络中

学位

移动边缘计算无线缓存深度强化学习联邦学习内容更新缓存命中率

某火炮链式弹仓机电系统高精度位置控制研究

本文以某自动装填系统中链式弹仓子系统为研究对象,结合滑模控制、自适应控制、扰动观测及模糊控制等先进控制理论,对链式弹仓位置控制系统相关问题进行了深入研究。主要研究内容包括以下几部分:（1）详细阐述了链式弹仓系统的结构特性、工作原理。对链式弹仓系统进行了动力学分析,以其执行机构为等效元件,根据动能守恒定理得到弹仓系统的等效数学模型,为后续链式弹仓控制系统的设计奠定了基础。采用三维建模软件建立弹仓系统

学位

链式弹仓滑模控制扰动观测自适应控制模糊控制

地奥心血康治疗大鼠非酒精性单纯性脂肪肝的实验研究

目的研究地奥心血康对大鼠非酒精性单纯性脂肪肝（nonalcoholicfattyliver,NAFL）的治疗作用。方法将♂SD大鼠，随机分为正常组和造模组，高脂高胆固醇饲料饲喂8周，待造模成功后将造模组大鼠随机分为模型组、阿托伐他汀组(2.0 mg·kg–1)，地奥心血康高、中、低(100,30,10 mg·kg–1)剂量组，每组10只，灌胃给药连续8周。油酸-棕榈酸（Oleic acid-p

期刊

地奥心血康非酒精性单纯性脂肪肝脂质代谢紊乱肝损伤实验研究

面向智能书柜的书脊检测与识别关键技术研究与实现

随着人工智能的快速发展,为了降低人工成本,图书的智能化管理是一个重要研究方向。本文面向智能书柜这一应用,其功能是通过对书脊的检测与识别方式完成图书的自助借还。现有书脊检测与识别方法主要有基于RFID技术的识别和基于图像文字识别两种,但是RFID技术存在较高的硬件成本问题,而基于图像文字识别的方法又存在识别准确率低的问题。不同于以上两种方法,尤其不同于基于图像文字识别的方法,本文将书脊检测与识别问题

学位

书脊检测书脊识别实例分割SIFT图书系统

基于图像的卷积神经网络与深度学习的车型分类识别方法研究

利用可见光图像进行车型分类在监控车道、检测套牌车、高速ETC收费、自动驾驶、军事车辆精确打击等应用场景中具有较高研究与实用价值。基于深度卷积神经网络的车型分类方法性能优于其他机器学习方法,是一个重要的研究方向。但多尺度、小样本数据集、嵌入式实时性差等因素会影响传统深度卷积神经网络在车型分类中的应用效果。针对这些问题,本文进行了基于深度卷积神经网络方法、可用于多尺度小样本数据集中、具有一定嵌入式实时

学位

车型分类目标识别深度卷积神经网络多尺度小样本数据集

基于深度强化学习的野外场景下目标跟踪关键技术研究

与本文相关的学术论文