基于强化学习的无人艇路径规划方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:hr2037283
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无人艇(Unmanned Surface Vehicle,USV)在海洋环境中高度自主航行是造船以及航海运产业链的一个新目标。无人艇自主避碰并合理进行路径规划能力是该目标的核心,也是完全自主无人艇在实际应用中的关键技术。强化学习探索学习理念为无人艇在未知环境下的路径规划提供一种新的解决思路。本文通过改进强化学习算法并结合人工势场法处理无人艇在不同环境下的路径规划问题,主要的研究工作叙述如下。首先,通过对无人艇、路径规划技术、强化学习算法的研究现状进行分析,明确了课题研究背景及意义,并对无人艇的避碰规划的基本理论进行建模和计算,对课题采用的强化学习算法的模型和收敛性进行严格推导和证明。其次,针对无人艇在狭窄水域复杂环境下的路径规划问题,提出基于无人艇操纵特性的改进Q-Learning强化学习算法。通过无人艇的运动特性进行算法优化,利用无人艇每一时刻的位置和航向作为算法的状态空间、基于无人艇回转特性进行动作空间优化、动态奖惩函数对路径规划具有启发和引导作用、模拟退火法自适应可变探索率解决了强化学习算法利用和探索二者之间平衡的难题,以此为基础给出障碍物分布密集的静态环境下无人艇路径规划策略。通过设计仿真对比试验验证改进算法在无人艇路径规划上的合理可行性。然后,针对无人艇在航行过程中遇到障碍物需要快速决策并且环境信息获取有误等原因造成的未知障碍物在静态路径规划中没有被考虑等问题,提出强化-势场法进行全局路径规划决策。人工势场法无法解决的局部震荡问题通过提出稳定震荡检测算法,进入局部稳定区域时采取在虚拟最小局部范围内吸引力角度改变策略跳出局部最小值。利用强化学习固有的学习能力对人工势场法的增益参数和改进策略中角度变化量和虚拟最小局部范围的大小进行在线调整和优化,改善参数对于算法敏感度较高的问题。保持了传统人工势场法在路径规划上的优势同时提升了算法路径规划性能。通过对不同障碍物地图进行仿真实验验证所提算法的可实施性。最后,针对无人艇躲避动态船舶的动态路径规划问题提出无人艇动态避碰模型。在目标船和无人艇相对运动参数以及会遇态势划分的基础上,引入运动障碍物的速度斥力场,将静态的人工势场变成动态的人工势场。设置无人艇安全区域向量场,指导无人艇按照海上避碰规则进行相关的避碰操作。通过对不同会遇态势下无人艇局部避碰路径规划以及混合路径规划进行仿真实验。实验结果验证无人艇对运动船舶的避让操作在符合避碰规则的基础上还满足避碰安全性和实时性。
其他文献
标记高光谱遥感图像是十分困难的工作,因而标记样本少成为了深度学习方法用于高光谱图像分类的阻碍。对此,本文提出了适合小样本图像分类的监督和半监督深度学习方法,主要工作如下:(1)提出适合小样本高光谱图像分类的监督深度学习模型即多尺度多级光谱空间特征融合(Multiscale Multistage Spectral Spatial Features Fusion,M2S2F2)框架,为使模型能在小样本
木质纤维素类生物质是一种广泛存在的可再生资源,实现其组分的高效分离与高值化转化已成为研究热点。本论文以甲苯—乙醇抽提杂交狼尾草为原料,选取邻苯二甲酸二乙酯为溶剂,硫酸为催化剂,构建两相水合熔盐体系直接催化杂交狼尾草同时制备糠醛和乙酰丙酸。首先在同一实验条件下,考察氯化锌、氯化铁、氯化锂、溴化锂四种酸性水合熔盐体系对杂交狼尾草糖化效果,其中溴化锂糖化效果最优,然后对酸性溴化锂水合熔盐处理杂交狼尾草的
在当今贸易全球化的形势下,跨国商业贸易中出现了大量的不正当竞争现象,这种涉外的侵权行为不仅侵害了不同国家与地区竞争者之间的私人利益,还对世界各国的市场秩序等公共利益造成了损害。针对这种带有一定公法性质的国际经济侵权行为,在各国实体法规定不同的情形下会产生法律冲突,国际组织希望建立统一的竞争法实体规范、各国希望通过竞争法的域外适用、直接适用的法等方式解决法律冲突问题,但是由于竞争法领域存在大量的私人
研究目的本研究旨在通过分析补益类中成药说明书功能与主治的语言特点与英译现状、调查国外消费者对补益类中成药说明书功能与主治英译的理解与认可程度,在此基础上,探讨文本类型理论指导下的补益类中成药说明书功能主治的英译,从而总结英译策略,为补益类中成药说明书功能主治的英译提供建议。研究方法本研究主要采用文本分析和问卷调查相结合的研究方法。(1)文本分析法以19份补益类中成药说明书功能主治(中英文)部分为研
基于羟基自由基(HO?)和硫酸根自由基(SO_4-?)的高级氧化技术已经成为了水中有机污染物处理的热点方向,高效稳定的催化剂的开发需求也十分迫切。本文通过共沉淀法制备了基于Fe_3O_4的Fe-Mn和Fe-Cu双金属催化剂,通过使用催化剂活化过一硫酸盐(PMS)分别降解罗丹明B(Rh B)和对硝基苯酚(PNP),研究Fe-Mn和Fe-Cu双金属催化剂的性能,优化了降解实验条件,鉴定体系自由基,探究
钮襀亚科(Acroneuriinae)隶属于襀翅目(Plecoptera)、北襀亚目(Arctoperlaria)、原颚类(Systellognatha)、襀科(Perlidae)。长期以来,钮襀亚科属级分类阶元的划分较为混乱,各属之间的系统发育关系不清,为了更好的弄清楚钮襀亚科属级阶元的划分界限以及系统发育关系,本文对钮襀亚科4属、30个样本的cox1基因和18SrDNA基因片段进行了扩增,分别
地下卤水资源丰富的四川盆地具有独特的矿产资源优势,为了综合开发利用该地下卤水资源,进一步促进盐卤化工的发展,开展相平衡研究从而掌握四川盆地地下卤水盐矿的基本析盐规
全地形轮式移动机器人因为其具有结构简单、运动灵活、易于控制的特点,使得其广泛运用于户外环境。随着户外环境复杂程度的增加,对全地形移动机器人性能的要求也随之提升。在转向过程中的车身不稳问题一直是学者广泛讨论的问题,解决这一问题的方案主要表现在两个方面,一是集中在对悬架减振系统进行创新设计,二是设计转向控制系统,通过控制轮速或转矩提高系统稳定性。本文将两种方法相结合,设计一种悬架减振系统与转向控制策略
2018年3月13日,税收征管体制在我国发生重大变化。按照中央的改革方案,合并省级和省级以下国、地税机构,同时将全部非税收入划入税务部门征收。在“营改增”全面推进的基础上,此次国地税机构合并的重大制度变革是顺应新时代发展要求的。机构改革期间,纳税服务部门作为前沿阵地,如何创新思路,探索改进纳税服务,不断优化税收营商环境,是我们需要持续研究的问题。首先,本文的研究意义分为理论和实践两部分。我国在纳税
油藏处于高含水阶段,剩余油分散,层系间含水差异减小,同井多层高含水矛盾日益突出。目前,同井多井段分层采油工艺技术已经基本完善,大规模推广成为可能,但由于分层采油后井间渗流规律不明确,缺乏细分采油潜力评价理论依据。因此,为了正确评价多层合采井细分采油潜力、准确预测产能,有必要针对细分采油潜力评价进行更加深入、全面的研究。首先,采用不同渗透率的九管岩心并联实验,研究不同注入速度条件下不同含水阶段对产能