优先经验回放相关论文
路径规划作为移动机器人自主航行的重要组成部分,受到学者们的广泛关注与研究。如何使机器人适应多样性环境,实现自主路径规划,是......
移动机器人作为智能机器人的重要分支,一直是当前众多学者的研究热点,其路径规划和避障也是移动机器人技术研究中的核心内容。近年......
针对在复杂军事化背景下多智能体决策算法探索效率低下、收敛缓慢的问题,提出了基于多头注意力机制和优先经验回放的多智能体深度确......
无人驾驶是当今人工智能技术热门应用场景之一,也是众多学者的研究热点。路径规划作为无人驾驶的关键技术之一,对推动智能汽车的快......
未来海战场形势瞬息万变,亟需依托人工智能技术实现对海战场环境的高质量作战仿真,以全面优化和提升我军战斗力,达成克敌制胜的目的。......
近年来随着科技的进步,深度学习和强化学习的发展迎来空前盛况。深度强化学习技术逐渐成为诸多领域的热点技术。作为多智能体领域......
为解决空域日益拥堵、空中交通流量日益增加等问题,美国联邦航空管理局提出了自由飞行的概念。伴随该概念的提出,空中交通管制问题......
为解决无人驾驶路径规划过程中的决策控制问题,文章针对深度确定性策略梯度算法在未知环境中随着搜索空间的增大,出现训练效率低、......
为了提高无人机(Unmanned Aerial Vehicle,UAV)系统的智能避障性能,提出了一种基于双延迟深度确定性策略梯度(Twin Delayed Deep D......
多智能体深度确定性策略梯度(multi-agent deep deterministic policy gradient,MADDPG)算法是深度强化学习方法在多智能体系统(mu......
摘要:本文从研究深度学习出发,提出深度学习在增强学习领域能被高等教育借鉴的三种重要算法:时间差分学习、优先经验回放、创新指数,通......