多智能体博弈学习研究进展

来源 :系统工程与电子技术 | 被引量 : 0次 | 上传用户:k88ls06
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习和强化学习而来的人工智能新浪潮,为智能体从感知输入到行动决策输出提供了“端到端”解决方案。多智能体学习是研究智能博弈对抗的前沿课题,面临着对抗性环境、非平稳对手、不完全信息和不确定行动等诸多难题与挑战。本文从博弈论视角入手,首先给出了多智能体学习系统组成、进行了多智能体学习概述、简要介绍了各类多智能体学习研究方法。其次围绕多智能体博弈学习框架,介绍了多智能体博弈基础模型及元博弈模型,均衡解概念和博弈动力学,学习目标多样、环境(对手)非平稳、均衡难解且易变等挑战。再次全面梳理了多智能体博弈策略学习方法,离线博弈策略学习方法,如随机博弈策略学习、扩展式博弈策略学习、元博弈种群策略学习方法,在线博弈策略学习方法,如在线优化与无悔学习、对手建模与利用、角色匹配与临机协调。最后从智能体认知行为建模与协同、通用博弈策略学习方法和分布式博弈策略学习框架共三个方面探讨了多智能体学习的前沿研究方向。
其他文献
直接侵害精神性人格权的案件类型在国家赔偿法中欠缺救济规范。修法进路因国家赔偿所具有的不同于民事赔偿制度的特殊性而存在诸多阻碍。从司法层面出发,其为有意识的自始漏洞,司法者可以通过目的性扩张、类推适用、利益衡量进行法律续造。但也应注意到国家赔偿涉及利益主体多元性、不同赔偿责任方式之特殊性、以及不同赔偿类型之制度功能对法律续造所构成的限制。如此,国家侵权精神损害赔偿范围的扩大方具有可行性。
我国博物馆与中小学教育结合的工作尚在起步和发展阶段,对中小型博物馆而言,由于各项资源有限,面临的挑战更为严峻。本文从济南市博物馆的实践出发,通过国际先进经验、政府宏观指导、博物馆为“主体”的具体分析,归纳总结出提升中小型博物馆与中小学教育结合的新思路、新途径。
众所周知,小学语文阅读是语文教育的重要组成部分。随着新课程改革的不断发展和实施,基础语文教育体系发生了空前变化。在此背景下,培养好学生的阅读兴趣成为基础语文教育教学的重中之重。培养学生的阅读兴趣,不仅有利于学生养成良好的学习习惯,提高学生的阅读能力,拓展学生的视野,扩大学生的知识储备,还可以显著提升学生对知识的综合理解能力。本文主要分析小学语文阅读教学现状,并提出新课标下培养和提高学生语文阅读兴趣
既有文献显示,“幼儿园男教师重要但匮乏”已经成为当前相关研究的主流话语,但却鲜有研究关注到该话语的生成路径,因此,有必要从话语路径的视角重新对幼儿园男教师的相关研究进行梳理、解构和反思,以揭示被话语遮蔽的权力运作。研究发现:第一,对幼儿园男教师性别职业优势的研究经历了从“经验化”到“概念化”的转变,但却普遍缺乏实证支持;第二,已有研究在男教师性别职业优势的逻辑上,进一步将幼儿园教师女多男少的“现状
基于四川体育发展的需要,为推动实现四川体育产业的高质量发展,本文通过文献资料、数据对比等研究方法,分析了四川体育产业发展现状。结果发现:四川体育产业规模处于上升期,远景规划振奋人心;产业结构多样化,亟须升级产业结构的内部要素;产业布局广,区域空间发展不均衡;产业融合度不高、专业人才匮乏等现实困境。研究提出了四川体育产业高质量发展路径,即:国家宏观产业政策引领,做强四川体育产业规模;调整四川体育产业