定性动作相关论文
将分层强化学习算法中的子任务应用于同类学习任务中是当前强化学习的一个研究热点。在控制系统中,分层强化学习算法存在着子任务......
在强化学习的研究中,常用的知识传递方法通过抽取系统最优策略的特征获得知识,由于所获得知识通常与系统参数有关,因此这些方法难以应......