基于强化学习的自主式水下潜器障碍规避技术(英文)

来源 :null | 被引量 : 8次 | 上传用户:edwinshi97531
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Obstacle avoidance becomes a very challenging task for an autonomous underwater vehicle(AUV) in an unknown underwater environment during exploration process. Successful control in such case may be achieved using the model-based classical control techniques like PID and MPC but it required an accurate mathematical model of AUV and may fail due to parametric uncertainties, disturbance, or plant model mismatch. On the other hand, model-free reinforcement learning(RL) algorithm can be designed using actual behavior of AUV plant in an unknown environment and the learned control may not get affected by model uncertainties like a classical control approach. Unlike model-based control model-free RL based controller does not require to manually tune controller with the changing environment. A standard RL based one-step Q-learning based control can be utilized for obstacle avoidance but it has tendency to explore all possible actions at given state which may increase number of collision.Hence a modified Q-learning based control approach is proposed to deal with these problems in unknown environment.Furthermore, function approximation is utilized using neural network(NN) to overcome the continuous states and large statespace problems which arise in RL-based controller design. The proposed modified Q-learning algorithm is validated using MATLAB simulations by comparing it with standard Q-learning algorithm for single obstacle avoidance. Also, the same algorithm is utilized to deal with multiple obstacle avoidance problems.
其他文献
目的 对比观察老年高血压患者应用不同类别降压药物进行治疗的临床效果。方法 选取2019年9月-2021年10月北京市顺义区医院内科门诊的老年高血压患者128例,根据组间资料均衡可比原则分为A组和B组,各64例。A组予以肾上腺素受体阻断剂和利尿剂治疗,B组予以血管紧张素转化酶抑制剂和钙离子拮抗剂治疗。治疗3个月后,就两组患者的血压状况、临床疗效、不良反应以及满意度等情况进行比较。结果 经过临床治疗后
氨氯地平,别名络活喜、安洛地平、阿洛地平、二氢吡啶磺酸盐,为世界卫生组织(WHO)指定的治疗高血压优选药,推荐为高血压单药治疗方案的起始用药。目前临床常用的有马来酸氨氯地平、苯磺酸氨氯地平、甲磺酸氨氯地平、马来酸左旋氨氯地平片、苯磺酸左旋氨氯地平片、缬沙坦氨氯地平等。氨氯地平优点多氨氯地平是钙离子拮抗剂,与钙离子通道结合后,阻止了钙离子进入细胞,从而使血管松弛,阻力减小,血压降低,对轻中度高血压患
期刊
中国是礼仪之邦,礼是中国文化的核心内容之一。茶文化作为中国传统文化的有机组成部分,深受礼的制约和影响;不仅如此,茶文化又是中国传统文化的承载者,茶文化的发展变化时刻反映着中国社会的发展变迁。茶艺是茶与礼的结合,体现了中国传统文化中核心要素与中国人饮食生活的融合,因此,在当前弘扬民族文化自信的背景下,对于推动传统文化与茶艺更好结合,推动茶文化乃至传统文化发展的问题不但具有理论意义而且具有实践的价值。
针对电网在台风、冰冻等极端条件下发生故障的诊断问题,提出利用标准遥信及广域测量系统(wide area measurement system,WAMS)数据训练Alexnet模型,并应用于电网故障诊断的方案。首先利用标准故障遥信信息和WAMS数据构造Alexnet的输入图片矩阵,对Alexnet进行训练。然后对Alexnet输入图片高维特征提取方法进行分析,提出构造最优分布结构的输入图片矩阵方法,
在驱傩仪式中,驱傩主角首先由兽类充当。随着人类在驱傩叙事中主体地位的日益凸显,驱傩主角又逐渐演变为由人类和兽类共同充当,直至最后完全由人类本身充当。傩面具造型也相应地呈现出从“兽面造型”到“半人半兽造型”、再到“人面造型”的发展趋势。其文化动因在于:傩面具赋予了巫师穿越不同世界的跨世界同一性,是巫师往返于现实世界与可能世界之间的可通达渠道;它在造型上与人面面具的相似度越大,驱傩可能世界与现实世界的
系统测试是在系统投入使用前,对整体系统的各功能模块及各要素之间进行使用情况审核的测试。论文从系统测试的概述出发,以某招标系统的测试为例,从功能测试以及非功能测试两个方面对系统进行测试,给出了系统测试用例。
钙拮抗剂又称钙通道阻滞剂,是高血压治疗中一类非常重要的药物,与利尿剂、β受体阻滞剂、血管紧张素转化酶抑制剂(ACEI)、血管紧张素Ⅱ受体拮抗剂(ARBs)并列于我国高血压治疗的五大类一线降压药物。相关资料显示,我国有一半以上服药治疗的高血压患者在应用钙离子拮抗剂。钙拮抗剂可分为二氢吡啶类和非二氢吡啶类,前者如硝苯地平片,其药名末尾均带有“地平”两字,俗称“地平类”降压片;后者如维拉帕米、地尔硫艹卓
期刊
本文基于PX4飞控的四旋翼无人机在Gazebo仿真环境中进行强化学习训练的相关研究中,需要解决强化学习与仿真环境交互接口问题。本文首先介绍了PX4飞控、外部程序、Gazebo仿真环境相互间的交互方式,然后介绍了用于无人机自主着陆控制问题研究的强化学习基本模型。为了有效支撑强化学习训练,重点研究了基于Gazebo和PX4的无人机仿真环境接口程序的设计与实现方法。经实验验证,该方法编写的接口程序能够顺
在卫星通信系统中,频率和信道是十分珍稀的资源,针对如何利用可靠且高效的方法来进行资源的开发这一亟需解决的难题,提出了一种基于Q-learning深度强化学习的动态卫星信道分配算法DRL-DCA,该算法将卫星和环境交互建模为马尔科夫决策过程,通过环境的反馈提升卫星的决策能力,实现用户业务请求的高效应答,提升卫星通信的服务质量,降低通信阻塞发生概率。仿真分析表明该算法能够有效地提升通信的吞吐量,降低通
针对深度强化学习算法在多对多近距空战决策过程中存在难以处理高维状态空间、难收敛等问题,提出一种基于注意力机制的近端策略优化算法。在经典的近端策略优化算法基础上引入注意力的思想,通过构造基于空战威胁度的注意力模型,对多机作战的空战态势信息进行注意力分配与信息聚合,使算法不用直接处理高维状态空间。2V2近距空战仿真实验结果表明,在初始状态为优势和劣势的情形下,基于注意力机制的近端策略优化算法训练的模型