在线Q学习相关论文
本文将在线Q学习方法与附加控制思想相结合,讨论了其在线性离散系统无模型化最优跟踪控制问题上的应用。首先在线性二次型跟踪器问......
为改善交叉口排队长度管理,避免交叉口某个方向排队长度过长,采用强化学习理论建立了以平均排队长度差最小为优化目标的在线Q学习......
建立了以平均排队长度差最小为优化目标的在线Q学习模型.针对控制性能指标相对于临近的配时方案不敏感的特点,提出了以平均排队长度......
该文将在线Q学习方法与附加控制思想相结合,讨论了其在伺服系统中电机速度最优跟踪控制问题上的应用。首先在线性二次型跟踪器问题......