Q(λ)算法相关硕士博士期刊学术论文

Q（λ）学习算法是一种结合值迭代与随机逼近的思想的基于模型无关的多步离策略强化学习算法．针对经典的Q（λ）学习算法执行效率低、收敛速......

期刊

结合电网能流和碳排放流的传输特性,建立了电网最优碳-能复合流的数学模型,并提出了基于群智能的多步回溯Q（λ）强化学习算法,有效解......

期刊

Q学习是一种重要的强化学习算法.本文针对Q学习和Q（λ）算法的不足，提出了一种具有多步预见能力的Q学习方法：MQ方法.首先给出了MDP模型，......

期刊

强化学习 MQ 算法 Q 学习 Q(λ)算法

将函数逼近用于强化学习是目前机器学习领域的一个新的研究热点．针对传统的基于查询表及函数逼近的Q（A）学习算法在大规模状态空间中收......

期刊