【摘 要】
:
对于较大规模的多智能体决策规划问题,用传统的基于Markov决策过程的方法一般很难解决。本文研究完全分布式控制方式、存在部分感知的条件下智能体的决策规划方法,以达到多智
论文部分内容阅读
对于较大规模的多智能体决策规划问题,用传统的基于Markov决策过程的方法一般很难解决。本文研究完全分布式控制方式、存在部分感知的条件下智能体的决策规划方法,以达到多智能体协同完成总体任务的目标。基于MAXQ值函数分解方法对问题进行层次分解,设计利用有限感知的多智能体决策框架结构,提出了采用与或图表示可行策略路径并结合Q-learning学习算法在线策略求解的算法。在RoboCup2D平台上对算法的性能进行试验,结果表明该算法在保证实时性的同时,能得到较好的策略。
其他文献
对柴达木野生黑果枸杞果实中的主要营养成分进行了分析,结果表明,黑果枸杞鲜果含水质量分数85.03%,其干果蛋白质量分数10.61%,脂肪6.66%,多糖4.28%,总黄酮质量分数4.29%,原花
证人出庭作证对查明案件事实,保证审判公正有着不容忽视的作用,立法上也有明确规定证人在无特殊情况下应当出庭。但是在我国刑事诉讼实践中,证人出庭率普遍偏低,证人出庭制度
"酒香也怕巷子深",为了使自己的商品被别人知晓,越来越多的商家意识到对其商品进行介绍、宣传的重要性,纷纷聘请名人为其产品代言。因此要规范明星对其代言广告的行为,明确其
利用线性回归法、Man-Kendall检验法、R∕S分析法结合Hurst系数等方法,分析了1964-2014年堵河流域降水量的变化情况.结果表明,堵河流域年降水量有明显的年际变化,季节降水量
虚词"之"有多种用法,在常见句型"A之谓B"式中的词性和用法多有争议。文章以为,当A为指示代词"此"时,"之"为调整音节、舒缓语气的无义结构助词;当A为非指示代词时,"之"为指代前文A内容,
文章从L-QB300有机热载体的阻焦性能、热稳定性、粘度性能、可生物降解性、使用寿命等角度出发,综合考虑有机热载体在使用性能和环保等方面的要求。研制出了一种环境友好型合
背景与目的:Axin2是近期发现的Wnt信号转导系统的新基因,其在结直肠癌中最主要的突变形式为羧基端缺失突变(mutant-type Axin2,mtAxin2)。本研究的目的在于探索mtAxin2对Wnt
传统的丙烯酸聚合物由于合成方法简单,柔韧性、附着力好,成膜性能优异,已经得到广泛的应用,但仍存在耐水耐油性、耐污染性差的缺点,导致其应用受到了一定的限制。而氟碳聚合
随着全球环境问题的加剧,环境治理成为国际关系中的重要内容,各种国际环境机制应运而生。中美作为世界上最大的发展中国家和唯一的超级大国,对于全球环境的治理具有重大的影
2007年颁布实施的《中华人民共和国物权法》第16条正式确立了不动产的善意取得制度。然而,关于我国物权法律体系中是否有必要引入这一制度的争议仍然一直在学术界及实务界内