【摘 要】
:
本文提出一种多任务约束条件下基于强化学习的水面无人艇路径规划算法。利用灰色预测进行区域建议,提升神经网络检测连续视频帧中水面目标的速度和准确率,进而提高了路径规划
【机 构】
:
哈尔滨工程大学水下机器人技术重点实验室
论文部分内容阅读
本文提出一种多任务约束条件下基于强化学习的水面无人艇路径规划算法。利用灰色预测进行区域建议,提升神经网络检测连续视频帧中水面目标的速度和准确率,进而提高了路径规划环境建模的准确性。基于Q_learning算法进行在线训练,完成多任务约束条件下的无人艇路径规划。针对Q_learning算法在多任务约束条件下收敛较慢的问题,提出了一种基于任务分解奖赏函数的Q_learning算法。通过仿真试验,验证了在多任务约束条件下,采用强化学习进行路径规划的可行性,并通过实物试验,验证了该算法能够满足实际要求。
其他文献
1 临床资料患者,男性,76岁,因“脑出血”生活不能自理,卧床13个月,发生骶尾部褥疮2个月入院。既往有高血压和糖尿病史。入院时体温正常,血压120/80mmHg,双肺呼吸音清晰,无哕音,肝、脾肋
循证医学(evidence-based medicine,EBM)是21世纪临床医学教育发展的必然趋势,其核心思想是在医疗决策中将临床证据、个人经验与患者的实际情况和意愿三者相结合.循证医学思想极大地促进了临床医学教育观念和医学教育方式的转变,必将对临床教学、科研和医疗实践产生重大的影响。
本刊2020年第一期“纤维技术”栏目刊登的文章“钛系催化剂在聚对苯二甲酸乙二醇酯合成中的应用”的表1中,钛酸四丁酯对应的反应温度只有283℃,269℃应属三氧化二锑对应的反
目的探讨急性脑梗死后早期尿失禁的发生率及其与年龄、病变部位、病史等的关系。方法 351例脑梗死患者,根据卒中后10d内有无尿失禁分为2组,A组伴尿失禁,132例;B组无尿失禁,21
分析了影响LiNbO3波导型F-P滤波器性能的3个因素:传输损耗、端面缺陷、温度变化.推导了在考虑波导损耗时的功率传输函数表达式,制作的质子交换LiNbO3光波导的传输损耗为0.35dB/cm
由于生活水平的不断提高,人们摄入越来越多的高热量、高脂肪、高蛋白、低纤维,带来超重和肥胖,高血压、高血脂的患病率也越来越多.目前肥胖症与糖尿病已经成为危害人类健康的
2010年5月28日,美国德尔他4火箭成功发射首颗GPS-2F导航卫星,这标志着美国GPS现代化计划再次取得了重要进展。该卫星入轨以来,美国空军控制员和卫星制造商波音公司的工程师们
系统阐述了虹膜识别的原理和实现方法,提出将小波变换与Hough变换相结合定位虹膜外边界,采用同心圆渐变展开虹膜图像为矩形图像,根据纹理分布方差对分类距离加权.新算法在保持平移和缩放不变性的同时,有效地实现了虹膜识别.
针对目前高职医学教育的现状和高职医学生在执业助理医师资格实践技能考试中存在的问题,对高职医学生的诊断学实践技能培训及考核进行改革,提高学生临床实践能力,使毕业生能顺利拿到毕业证、资格证。
<正>党的十九大做出了人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾,是当前我国社会主要矛盾的论断。这一重大判断对未来企业发展和投资方向的选择将产生重大