基于视线检测的智能体路径规划技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:zzmaazhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能体是实施智能行为的一个载体,它可以是机器人、虚拟游戏角色等等。让智能体拥有真正的智能行为一直都是科研工作者的目标,而路径规划任务是体现智能行为的一个重要环节。常规意义上的智能可以从环境感知、认知以及行为规划等角度进行探讨。其中,感知是指对周围环境的探测,例如智能传感器的信号采集;认知是指对环境信号的解析,例如对图片内容的辨识;行动是指对环境采取的反馈措施,涉及到智能体的决策能力。实际上,路径规划是智能体采取行动的前提,只有规划好了方案,智能体才能安全移动。路径规划的本质是序列决策问题,它的目标是在不碰撞任何障碍物的情况下从初始点到达目标点。本文的研究内容侧重于将视线检测与主流的路径规划算法融合,主要的创新点如下:1.针对低维空间中大尺寸网格地图的规划问题,本文提出一种基于延迟视线检测与局部更新策略的LLA*算法,快速规划出高质量的路径。基于网格的路径规划算法经常用于移动机器人、游戏角色的规划任务,但是这类方法共有的问题是它们规划出的路径往往被限制在网格边,无法找到真正的最短路径。局部更新策略将会优先更新那些可以改进最终结果的节点,从而加快规划速度。另外,延迟的视线检测在改善路径的同时也会避免不必要的碰撞检测,从而减少计算量。本文选取了 Moving AI实验室的路径规划基准测试集进行算法的验证,并且将A*、Theta*、Lazy Theta*与LLA*进行对比,结果显示LLA*算法的速度最快,而且规划出的路径质量优于Lazy Theta*和A*。2.针对高维空间运动规划算法收敛速度慢的问题,本文提出了一种基于延迟视线检测和下限值策略的通用优化框架LaLo-Check,加快规划速度。基于采样的运动规划算法常用于高维的机械臂的运动规划任务,由于避免了对整个构型空间进行建模,它们往往可以快速的规划出可行解。不过,也正是由于随机采样的特性,此类算法往往很难找到最优解。碰撞检测是基于采样的规划算法的瓶颈,而下限值策略的目标是减少不必要的碰撞检测,这其中包括视线检测。本文在OMPL的基础上实现了延迟视线检测框架LaLo-Check,并选择了多种主流的基于采样的规划算法进行评测,最终的结果显示经过延迟视线检测优化后的算法比原始算法更快地收敛到最优解。值得一提的是,LaLo-Check可以应用于大多数具有树结构的基于采样的路径规划算法。3.深度强化学习规划网络能够自主学习规划策略,但很难规划出真正的最优解,本文提出一种路径简化算法LoSS,用来优化规划网络的结果。基于深度强化学习的路径规划网络是近些年来蓬勃发展的研究方向,具有端到端训练的特性,备受推崇。价值迭代网络(VIN)成功的将马尔科夫决策过程的价值迭代求解过程模型化,而门限路径规划网络(GPPN)则用循环神经网络结构改进了 VIN,使网络的学习能力得以增强。但是,由于训练样本的制约,这些网络很难规划出最短路径。为此,本文提出一种基于视线检测的路径简化算法LoSS,用于平滑VIN和GPPN规划出的路径,使最终的路径更短、更直接。
其他文献
视觉目标跟踪是计算机视觉研究领域的重要课题,目前,视觉目标跟踪领域研究人员相继提出了一系列优秀的算法和框架,但鉴于目标跟踪过程中的形变、遮挡、光照变化、随机性运动等问题,要保证跟踪算法实时性、准确性和鲁棒性依然面临很大的挑战。针对上述问题,本文基于经典的相关滤波目标跟踪框架提出了一种改进的目标跟踪算法。首先,本文分析了卷积神经网络不同层输出的目标特征在跟踪任务中的不同作用。其次,本文研究了使用精度
从第二次世界大战开始,磁异探测技术(MAD)就开始应用在军事领域。近年来,随着弱磁传感器技术的进步,磁异探测技术在军事应用方面得到了进一步的重视和发展,磁异信号检测技术就是磁异探测最关键的技术之一,其本质就是如何从低信噪比的磁测量信号中判断有无磁异信号存在。本文拟将神经网络作为二分类器引入到磁异信号检测技术中,并从自动特征提取和人工特征提取两个方面,研究神经网络在磁异信号检测中的应用,为水下目标探
近年来,随着水声技术的发展,水下目标跟踪技术得到了越来越广泛的关注,其对充分利用我国海洋资源、维护我国海洋权益起着至关重要的作用。在战时监视,声纳探测,水下武器对抗,及海洋资源的开发等领域有着广泛的应用价值和重要的战略意义。本文针对水下目标跟踪的两大热点--粒子滤波算法和联合概率数据关联算法,展开了理论研究和仿真研究,重点从计算的实时性和跟踪的误差性提出改进措施。首先,本文阐述了基本滤波理论。给出
中国少数民族称谓语研究是个亟待重新开发和深入的领域。论文数据源自新中国成立初期至2020年4月终的中国知网期刊全文数据库中所有中国少数民族称谓语的研究文献。我们系统回顾了中国少数民族称谓语的分类、泛化、简化、缺环、文化释源方面的研究成果,发现其亲属称谓语在细类划分、泛化使用和文化释源上各具自身的民族称谓特点,但在简化和缺环方面缺乏有价值的研究发现;其非亲属称谓语研究发现仍显空白。作为前瞻性研究思考
网络表征学习是针对大规模复杂网络数据进行分析和处理的方法,是研究者们一直以来广泛关注的领域。尽管已经出现了非常多针对网络表征学习问题的有效模型,但是仍然存在没有充分考虑异构网络、对标签信息利用不够完全等问题。随着神经网络模型的不断发展和壮大,其在图像、音视频、文本处理等领域表现出了良好的性能,如何将其应用于网络表征学习需要更进一步的探索。针对上述问题,本文开展了深入的学习和调研,完成了以下工作:本
本文以系统功能语言学为理论框架,对2018年美国西点军校教务长杰布·辛迪准将率团访问中国人民解放军陆军工程大学时所做演讲及葛约翰中校为其所做交替传译进行案例研究,从语气、情态和语调三个系统分别对源语和目标语进行对比分析,考察目标语所实现的人际意义是否与源语一致,进而对此次军事外交活动的交际效果进行评估。韩礼德在功能语法中提出语言的三种元功能,分别是经验功能、人际功能和语篇功能。其中,人际功能体现语
随着导航精度需求的提高,多源导航逐渐成为了航天任务的首选方式。路标导航随着光学技术的发展应运而生,并且同CNS互相补偿,以提高组合导航的导航精度。同时,随着智能算法的发展,导航滤波算法也向着自适应性发展。因此,多源性、自适应性成为了导航新的发展方向,而高稳定性一直是导航的目标。本文以多源导航作为研究背景,主要做出了以下工作:(1)首先,在预处理阶段,通过BP神经网络对捕获的数据进行检测和补偿,获取
软件漏洞分析是网络空间安全的重要研究内容。现有软件漏洞分析方法存在效率不高,准确性差,通用性不强的缺陷。同时,真实程序执行流程长、调用关系复杂、条件分支多,使用当前方法进行漏洞分析面临更多困难。因此,研究一种新的软件漏洞分析方法,实现对大型软件漏洞进行高效分析,对于修复软件漏洞以及维护网络空间安全具有重要意义。论文围绕基于深度神经网络的软件漏洞分析技术展开研究。首先,本文提出了基于神经网络的漏洞分
为了解决传统EMS悬浮系统的缺点,并顺应国家对轨道交通节能提速的发展战略,国防科技大学积极开展了速度200km/h的永磁电磁混合悬浮型中速磁浮列车的研制工作,并于2018年成功研制出第五代新型磁浮试验样车。混合悬浮中速磁浮列车采用永磁电磁混合悬浮方案,与传统电磁型磁悬浮方案相比,前者能够有效减小系统的悬浮功耗;但是随着永磁体的加入,对于悬浮系统而言,控制难度增大、吸死后果更严重的问题也随之而来。本
脑机接口(Brain Computer Interface,BCI)技术是一种新型人机交互方式,它能让人们直接通过大脑意识活动和外部环境设备进行信息交流。这种沟通的方式可以不经过人体的神经系统和相关组织,从而帮助行动障碍患者重建于外界环境的联系。随着研究领域的不断深入,脑机接口的应用范围也开始拓展到健康人群的正常生命活动中。与此同时,自动驾驶技术迅速发展的过程中面临“脑容量”、复杂环境决策能力等离