Markov对策相关硕士博士期刊学术论文

Markov对策相关论文

Agent系统中强化学习技术及其应用的研究

该文主要的研究内容是Agent血和多Agent系统中的强化学习技术,以及将强化学习和其他技术相结合,应用于Agent和多Agent系统的混合学......

学位

强化学习 Agent 多Agent系统 Markov对策概率规划规划规则抽取机器人足球

基于学习与对策的多代理协同计算

本文首先提出了一种新的多代理在线学习算法LU-Q,该算法通过对联合行动不断地实施剪枝,减少可选行动数目,加快多代理学习的收敛.实......

学位

多代理 Markov对策强化学习协同策略协商递进学习梯度

基于 MarkoV对策和强化学习的多智能体协作研究

MAS的协作机制研究，当前比较适用的研究框架是非零和Markov对策及基于Q-算法的强化学习.但实际上在这种框架下的Agent强调独立学习......

期刊

Markov对策 Q-学习算法协调学习

Robocup半场防守中的一种强化学习算法

Robocup仿真比赛是研究多Agent之间协作和对抗理论的优秀平台，提高Agent的防守能力是一个具有挑战性的问题。为制定合理的防守策略，......

期刊

ROBOCUP 强化学习 MARKOV对策零和对策 Robocup reinforcement learning Markov game zero-su

多智能体协作技术综述

本文从协作模型和研究方法两个角度考察了多智能体协作技术的发展 ,认为是外在的理性形式化模型和内在的对策和学习机制是多智能体......

期刊

多智能体协作自协调模型递归建模 Markov对策强化学习

基于多级决策的多智能体自动导航车调度系统

提出基于多级决策和协作学习的方法来建立自动导航车（AGV）调度系统中每个AGV所需要的动态分布式调度策略。系统中的第一个AGV都由一......

期刊

多智能体自动导航车调度系统多级决策 MARKOV对策强化学习动态分布式调度策略 multilevel decision Markov games re

一般和对策中基于协商的多代理强化学习

一般和对策中,只考虑个体理性的多代理协作是一种无全局目标的协作.代理学习基于对手策略假设,不能保证假设的正确性.为此通过定义......

期刊

MARKOV对策强化学习多代理协作协商 Markov games reinforcement learning multiagent coordinati

基于Markov对策的多智能体协调方法及其在Robot Soccer中的应用

提出了一种分层的基于Markov对策的多智能体协调方法,根据多智能体之间的竞争和合作的关系,高层采用零和Markov对策解决与对手之间......

期刊

多智能体 MARKOV对策零和Markov对策团队Markov对策 ROBOT SOCCER multi-agent Markov game zero-su

基于Markov对策的强化学习及其在RoboCup中的应用

论文研究了Markov对策模型作为学习框架的强化学习,提出了针对RoboCup仿真球队决策问题这一类复杂问题的学习模型和具体算法.在实......

期刊

MARKOV对策多主体系统强化学习 ROBOCUP Markov games multi-agent system reinforcement lear

基于Agent的多机器人信息融合与协调研究

随着现代科学技术的飞速发展,机器人的开发与应用范围的不断扩大。对于不同的工作任务和不同的工作环境,尤其是一些大型复杂的工作......

学位

多机器人系统多Agent 信息融合多机器人协作证据推理强化学习强化函数 Markov对策

基于多级决策的多智能体自动导航车调度系统

提出基于多级决策和协作学习的方法来建立自动导航车 ( AGV)调度系统中每个 AGV所需要的动态分布式调度策略 .系统中的每一个 AGV......

期刊

多级决策 Markov对策强化学习 AGV调度系统

基于后悔值的多Agent冲突博弈强化学习模型

对于冲突博弈,研究了一种理性保守的行为选择方法,即最小化最坏情况下Agent的后悔值.在该方法下,Agent当前的行为策略在未来可能造......

期刊

Markov对策强化学习冲突博弈冲突消解

基于Markov对策的码垛机器人三维路径规划

针对码垛机器人应用环境状况较复杂、不确定条件较多的问题,使用基于Markov对策的算法对多关节码垛机器人进行路径规划。首先根据......

期刊

码垛机器人多关节机器人多Agent系统 Markov对策 Nash均衡

基于Markov对策和强化学习的多智能体协作研究

MAS的协作机制研究，当前比较适用的研究框架是非零和Markov对策及基于Q-算法的强化学习.但实际上在这种框架下的Agent强调独立学习......

期刊

Markov对策 Q-学习算法协调学习

基于Markov对策的机械臂二维路径规划

针对机械臂应用环境状况较复杂、不确定条件较多，文中使用基于Markov对策的算法对二维机械臂进行路径规划。二维机械臂路径规划是三......

期刊

多关节机器人机械臂多Agent系统 Markov对策 Nash均衡

看过本文同时还关注