MaxQ算法相关硕士博士期刊学术论文

本文以足球仿真机器人系统为研究平台，研究多智能体对抗系统的高层策略学习问题。通过对足球机器人系统的分析和研究，使用模糊手段描......

学位

具有抽象机制的分层强化学习方法可以实现状态空间的降维,从而解决大规模系统中的“维数灾”问题。由于引入了状态抽象机制,分层强......

学位

提出将MaxQ分层增强式学习应用于足球机器人进攻策略学习，提高了强化学习的性能。通过在Robocup中的应用和实验，得出基于MaxQ分层强......

期刊

针对MAXQ算法存在的弊端,提出一种改进的分层学习算法BMAXQ。该方法修改了MAXQ的抽象机制,利用BP神经网络的特点,使得Agent能够自......

期刊