Q_学习相关论文
该文首先介绍了强化学习模型—马尔可夫决策过程,以及它的一些基本概念.并根据计算状态值函数或状态动作对值函数方式的不同,详细......
随着城市交通流量日益增加,现有的交通灯固定时间控制系统不能很好解决交通拥堵问题。针对这一背景,采用基于Q_学习的交通灯控制策......
相关反馈算法是图像检索不可缺的重要组成部分,是近来图像检索中研究的一个热点。提出了基于强化学习的相关反馈算法。根据强化学习......