基于多智能体强化学习的机器人足球行为模型的研究

来源 :第十一届中国人工智能学术年会 | 被引量 : 0次 | 上传用户:wwling_girl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为完成一个团队的共同的目标,多智能体是如何学习的将是本文的研究目的.以机器人足球为背景,基于强化学习建立多智能体学习模型,实验表明,与单智能体学习比较,多智能体学习具有明显的优势,可以求解复杂的合作问题.
其他文献
临床实践指南是对某一疾病诊断试验的应用和不同治疗手段的有效性提供明确清晰的推荐意见.从而降低了临床实践的不一致性,减少不必要的诊断试验,防止采用无效的治疗手段和成
会议
目的 探讨广泛肝内胆管结石合并左右肝叶萎缩而尾状叶明显肥大的患者行保留尾状叶次全肝切除术的可行性和安全性.方法 回顾性分析四川大学华西医院2020年2月收治的l例肝内胆
根据我国经济社会不断发展,人民生活水平日益提高,物质文化需求越来越多样化的情况,大力发展休闲渔业,已成为拓展我国渔业发展新领域的一项重要内容.近年来,以渔为媒,集旅游
会议
针对流控制传输协议(SCTP)在主路径性能明显低于备用路径性能的情况下,不能自动进行切换而导致数据传输效率降低这一问题,在分析使用时延进行主路径自动切换方法的基础上,提出使用时延、带宽和丢包率3项指标进行路径性能综合评价的方法,并在此基础上实现了主路径自动切换。在NS2仿真实验的环境中进行了验证,实验结果表明:使用该方法降低了路径自动切换时间,同时降低了平均数据传输时延。
自愿报名设立菜站 1983年,我从文山壮族苗族自治州财贸学校毕业分配到麻栗坡县蔬菜公司工作。收复老山的战斗打响后,我自愿报名来到老山脚下的南温河支前蔬菜供应站工作。当
本文在阐述协作信息系统的基础上,给出了基于移动代理的协作信息中间件CISOM的设计与实现,然后利用它开发出新一代智能气田管理信息系统.从而可以随时、准确、全面的了解到气
本文提出一种基于非线性单纯形搜索的混合粒子群优化算法.该算法在粒子群优化的后期阶段,将接近极值的粒子从种群中隔离,用单纯形搜索加强其局部搜索能力.大量测试实验结果表
随着新世纪的到来,社会节奏加快,休闲旅游逐步成为人们化解压力,促进健康的活动.专家指出,20世纪是劳动文化的世纪,21世纪将是休闲文化的世纪.翔安区是是厦门海湾型城市框架
会议
本文研究了模糊层次分析法(FAHP)在机器人足球策略子系统中的应用,提出了将多种角色分配策略综合考虑的角色分配系统.首先构造角色分配的模糊决策系统,然后在该角色分配系统
会议
目的 比较肝脏移植术中两种常用的器官保存液(UW液与HTK液)的临床效果.方法 全面检索PubMed、Embase、Cochrane Library、中国期刊全文数据库、中国生物医学文献数据库、万方