MaxQ算法相关论文
本文以足球仿真机器人系统为研究平台,研究多智能体对抗系统的高层策略学习问题。通过对足球机器人系统的分析和研究,使用模糊手段描......
具有抽象机制的分层强化学习方法可以实现状态空间的降维,从而解决大规模系统中的“维数灾”问题。由于引入了状态抽象机制,分层强......
提出将MaxQ分层增强式学习应用于足球机器人进攻策略学习,提高了强化学习的性能。通过在Robocup中的应用和实验,得出基于MaxQ分层强......
针对MAXQ算法存在的弊端,提出一种改进的分层学习算法BMAXQ。该方法修改了MAXQ的抽象机制,利用BP神经网络的特点,使得Agent能够自......