动态环境下多传感器行星车自适应路径规划方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:sdfsdfsdfasdf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在星体表面运动时,行星车的路径规划作为自主决策系统的关键组成部分,是其能够安全高效地开展科学巡视探测的重要保证。特别是,在未来为了大规模探测高价值的科学目标,可能存在宇航员和多个移动机器人联合作业的情景,由此伴随着更为复杂的动态环境。在传统的规划方法中,行星车的所有行为都来自于地面人员预先定义好的规则,但是行星车的作业环境不是完全已知的,这时就需要行星车具备一定的自适应能力,应对环境发生的变化。为了进一步提升行星车的自主决策能力,并解决传统人为规划框架中过于依赖地图信息的问题,基于深度强化学习理论提出了端到端的路径规划方法,直接从传感器信息映射出动作指令再发布给行星车。同时采用不同的神经网络结构分别处理不同的传感器信息,最后将环境特征融合在一起,构成基于D3QN PER的多传感器行星车路径规划方法。首先,对深度强化学习的基础理论进行了深入的研究。分别采用卷积神经网络处理视觉图像信息,长短期记忆处理激光雷达点云信息和自身状态信息,继而给出了行星车的环境特征融合方案。同时汲取其他深度强化学习算法的优点,将D3QN PER算法应用于多传感器行星车的路径规划方法中,通过输出速度和角速度指令来控制它的运动。其次,搭建仿真环境,分三步验证算法的有效性。第一步,测试深度强化学习的相关算法是否能够在空旷的环境下引导行星车到达终点,由路径规划的结果可知,D3QN PER比DQN的其他衍生算法更具优势。第二步,将行星表面的沙砾和岩石简化为静态障碍环境,验证基于D3QN PER的多传感器行星车路径规划方法的避障性能,并将它与传统的RRT*算法进行了对比分析。第三步,将行星表面的宇航员和多个移动机器人简化为动态障碍环境,直接加载由静态障碍环境下训练好的网络模型,由实验结果可知,行星车对环境发生的变化具有较强的自适应能力,同时将该方法与传统的人工势场法进行了对比分析。最后,通过加载由仿真环境中训练好的网络模型,使用Jackal移动机器人进行了实物验证,测试了基于D3QN PER的路径规划方法在真实环境中的适应性,从而为实际的巡视探测提供可靠的实验支撑。
其他文献
考虑到市场上存在的水平领导结构和自有品牌模仿策略,针对两个对称竞争的制造商和单个零售商组成的市场渠道,探讨不同的领导权结构对品牌竞争产生的影响。研究结果表明:(1)对
电池安全是电池动力船舶发展的前提,也是国内外专家学者关注的焦点。电池动力船舶安全研究具有前瞻性,受数据可得性的影响,选用对数据依赖较小的事故树模型,从电池充换电的视
为了得到人参(Panax ginseng)多糖的高效提取方法,以提高人参多糖的提取效率,采用水提醇沉的方法提取多糖,采用L9(34)的正交试验优化人参多糖的工艺;并且在优化工艺条件下对
丹东是东北地区板栗的主产区,目前,全地区板栗面积超过150万亩,面积和产量均达到辽宁省的90%以上。随着农业产业结构的调整,丹东地区全面实施板栗倍增计划,其产业势头发展迅
要寻求文化创意产业的健康发展,一方面,从政策上给文化创意产业提供扶持政策,塑造一个良好的宏观发展环境;另一方面,文化创意产业需要提高自身的创意水平和整体创新能力,提高参与国
众所周知,语音、词汇和语法是语言的三大要素。语法好比建筑高楼大厦时的框架结构。只有语法好,写作才能好。无论学生的词汇量有多大,对题型有多么熟悉,如果语法不好,写出来
<正>由于脸书公司的大力开发与投资,经历了2017年和2018年的曲折发展之后,Libra项目让媒体行业再次关注区块链技术。区块链技术的应用前景广阔,微支付、不可更改的记录数据、
随着城市空间的不断压缩,户外锻炼环境的恶化,室内在跑步机上进行的健身跑越来越成为大学生的一种主流健身方式。然而当前市面上的跑步机虽提供了一些运用领域知识构建的可选
新一轮课堂改革的宗旨就是激发课堂活力,让学生在教师的组织、引导、诱发下保持最佳状态,培养学生主动获取知识、利用知识解决问题的能力。高中政治内容,具有抽象、深奥、枯燥的
很多人认为卢昊的成名很迅速,甚至堪称奇迹。自1999年卢昊参加威尼斯双年展到第二十五届圣保罗汉年展、法国里昂双年展和伊斯坦布尔双年展……卢昊的足迹遍及各个国家。2005