基于多智能体强化学习的机器人足球行为模型的研究

来源 :第十一届中国人工智能学术年会 | 被引量 : 0次 | 上传用户：wwling_girl

【摘要】

：

为完成一个团队的共同的目标,多智能体是如何学习的将是本文的研究目的.以机器人足球为背景,基于强化学习建立多智能体学习模型,实验表明,与单智能体学习比较,多智能体学习具

【作者】

：

李晓薇程显毅柯佳韩兰君

【机构】

：

江苏大学计算机科学与通信学院,江苏,镇江,212013

【出处】

：

第十一届中国人工智能学术年会

【发表日期】

：

2005年期

【关键词】

：

多智能体强化学习机器人足球多智能体学习学习模型如何学习合作问题团队实验求解目标

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

为完成一个团队的共同的目标,多智能体是如何学习的将是本文的研究目的.以机器人足球为背景,基于强化学习建立多智能体学习模型,实验表明,与单智能体学习比较,多智能体学习具有明显的优势,可以求解复杂的合作问题.

其他文献

中医耳鼻喉科临床实践指南的编制

临床实践指南是对某一疾病诊断试验的应用和不同治疗手段的有效性提供明确清晰的推荐意见.从而降低了临床实践的不一致性,减少不必要的诊断试验,防止采用无效的治疗手段和成

会议

广泛肝内胆管结石合并左右肝叶萎缩尾状叶明显肥大行保留尾状叶次全肝切除术1例报道

目的探讨广泛肝内胆管结石合并左右肝叶萎缩而尾状叶明显肥大的患者行保留尾状叶次全肝切除术的可行性和安全性.方法回顾性分析四川大学华西医院2020年2月收治的l例肝内胆

期刊

肝内胆管结石次全肝切除术尾状叶

休闲渔业是调整渔业产业结构的新亮点

根据我国经济社会不断发展,人民生活水平日益提高,物质文化需求越来越多样化的情况,大力发展休闲渔业,已成为拓展我国渔业发展新领域的一项重要内容.近年来,以渔为媒,集旅游

会议

基于综合性能评价方法的主路径自动切换

针对流控制传输协议(SCTP)在主路径性能明显低于备用路径性能的情况下，不能自动进行切换而导致数据传输效率降低这一问题，在分析使用时延进行主路径自动切换方法的基础上，提出使用时延、带宽和丢包率3项指标进行路径性能综合评价的方法，并在此基础上实现了主路径自动切换。在NS2仿真实验的环境中进行了验证，实验结果表明：使用该方法降低了路径自动切换时间，同时降低了平均数据传输时延。

期刊

综合性能评价方法流控制传输协议主路径性能数据传输时延

为了老山战斗的胜利

自愿报名设立菜站 1983年,我从文山壮族苗族自治州财贸学校毕业分配到麻栗坡县蔬菜公司工作。收复老山的战斗打响后,我自愿报名来到老山脚下的南温河支前蔬菜供应站工作。当

期刊

老山战斗毕业分配自愿报名南温河防毒口罩蔬菜公司麻栗坡县我不知道敲门声告诉我

基于移动代理的CISOM在气田管理信息系统中的应用

本文在阐述协作信息系统的基础上,给出了基于移动代理的协作信息中间件CISOM的设计与实现,然后利用它开发出新一代智能气田管理信息系统.从而可以随时、准确、全面的了解到气

会议

移动代理气田管理信息系统协作信息天然气工业业务合作信息整合信息交流中间件智能石油设计开发基础共享

一种结合单纯形搜索的多峰函数粒子群优化算法

本文提出一种基于非线性单纯形搜索的混合粒子群优化算法.该算法在粒子群优化的后期阶段,将接近极值的粒子从种群中隔离,用单纯形搜索加强其局部搜索能力.大量测试实验结果表

会议

单纯形搜索能力多峰函数粒子群优化算法优化成功率优化效果收敛速度全局极值局部混合算法测试实验非线性种群隔离方法

翔安休闲渔业发展研究

随着新世纪的到来,社会节奏加快,休闲旅游逐步成为人们化解压力,促进健康的活动.专家指出,20世纪是劳动文化的世纪,21世纪将是休闲文化的世纪.翔安区是是厦门海湾型城市框架

会议

基于FAHP的机器人足球角色分配系统

本文研究了模糊层次分析法(FAHP)在机器人足球策略子系统中的应用,提出了将多种角色分配策略综合考虑的角色分配系统.首先构造角色分配的模糊决策系统,然后在该角色分配系统

会议

UW与HTK保存液在肝脏移植术中临床效果对比的系统评价和meta分析

目的比较肝脏移植术中两种常用的器官保存液(UW液与HTK液)的临床效果.方法全面检索PubMed、Embase、Cochrane Library、中国期刊全文数据库、中国生物医学文献数据库、万方

期刊

肝脏移植UW液HTK液meta分析

基于多智能体强化学习的机器人足球行为模型的研究

与本文相关的学术论文