Sarsa算法相关论文
出租车是人们日常生活中最常见的交通工具之一.近年来,随着打车软件的普及,越来越多的人从事出租车行业.如何在错综复杂的城市路线......
机器人足球的研究涉及了人工智能、机器人学、计算机视觉及智能控制等多个领域,是目前机器人研究中的一个热点。由于机器人足球具有......
强化学习是一类无需先验知识的机器学习方法,以Agent与环境不断的交互为主要特征,以寻找能带来最大期望累积折扣奖赏的策略为目标。......
随着城市化进程的快速发展和人口数量的不断增加,人群密集区域安全事件频频发生,人的生命安全屡屡受到威胁,因此,为人群聚集场所制......
随机动态系统和勒贝格采样系统在通讯网络、柔性制造、人工智能、军事指挥管理、生产生活等各个领域有着广泛的应用,是学习和优化......
随着科技促进人民生活、信息化推进社会发展的需要,尤其是在自然灾害救援、环境现场监测、军事演习领域等公共部门以及重大通信事......
针对随机动态规划在求解风电-抽蓄联合系统日随机优化时出现的维数灾问题,提出采用强化学习的SARSA算法来解决.首先分析了风电出力......
雷达在工作过程中所应对的干扰场景复杂且多变,所具有的反干扰措施难以穷举.人工设计的反干扰流程与抑制策略在面对这些对抗场景时......
为了对蜂窝网络的信道进行在线、实时和动态的分配,设计了一种基于量子粒子群算法和SARSA算法的蜂窝网络信道分配方法;采用分配方......
城市交通路径规划需要考虑规划的快速性和车辆的安全性,而目前大多数强化学习算法不能兼顾两者。针对这个问题,首先提出采用基于模......
传统的强化学习算法应用到大状态、动作空间和任务复杂的马尔可夫决策过程问题时,存在收敛速度慢,训练时间长等问题.有效地学习和利用......
水声信道复杂多变,自适应调制系统中反馈信息存在较大的时延,实际信道状态与接收到的反馈信息无法匹配,带来反馈信道状态信息过时......
标准的Sarsa(λ)算法对状态空间的要求是离散的且空间较小,而实际问题中很多系统的状态空间是连续的或尽管是离散的但空间较大,这......
机器学习是近年来兴起的一门多领域交叉学科,其涉及到统计学、概率论、凸分析、逼近论和算法复杂度理论等多个学科。在机器学习理......
强化学习不需要具有先验知识,通过试错与环境交互获得策略的改进,具有自学习和在线学习能力,是构造智能体的核心技术之一。文中首......
针对复杂的、难以建模的城市交通系统,将多步强化学习算法SARSA(λ)应用于交通信号控制,根据实时的交通状态信息动态进行决策,自动适......