搜索筛选:
搜索耗时0.0838秒,为你在为你在102,285,761篇论文里面共找到 1 篇相符的论文内容
类      型:
[期刊论文] 作者:姚兴虎  宋光鑫, 来源:计算技术与自动化 年份:2021
摘 要:针对协作多智能体强化学习中的全局信用分配机制很难捕捉智能体之间的复杂协作关系及无法有效地处理非马尔可夫奖励信号的问题,提出了一种增强的协作多智能体强化学习中的全局信用分配机制。首先,设计了一种新的基于奖励高速路连接的全局信用分配结构,使得智......
相关搜索: