一种新的多智能体强化学习算法及其在多机器人协作任务中的应用

来源 :机器人 | 被引量 : 0次 | 上传用户:lulaiyue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在多机器人系统中 ,评价一个机器人行为的好坏常常依赖于其它机器人的行为 ,此时必须采用组合动作以实现多机器人的协作 ,但采用组合动作的强化学习算法由于学习空间异常庞大而收敛得极慢 .本文提出的新方法通过预测各机器人执行动作的概率来降低学习空间的维数 ,并应用于多机器人协作任务之中 .实验结果表明 ,基于预测的加速强化学习算法可以比原始算法更快地获得多机器人的协作策略 .
其他文献
自Plaignaud于1791年报告的第1例真菌性鼻-鼻窦炎(fungal rhinosinusitis,FRS)以来,对FRS的认识逐渐深入.1965年Hora首先报告了进展迅速、病情凶险和死亡率高的FRS,并冠名为急性暴发型侵袭性真菌性鼻-鼻窦炎(acute fulminant invasive fungal rhinosinusitis,AFIFRS).1997年deShazo等报告了一组进
制备了急冷型SnAgCu系钎料合金,在对其进行熔化特性测定和钎焊工艺试验后,对钎焊接头的力学性能和显微组织进行了测试分析,结果表明:所制备钎料合金的熔化特性满足要求;钎焊温度和