行动驱动的马尔可夫决策过程及在RoboCup中的应用

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:affairs365
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了更好地解决一类特殊的Agent决策问题,提出行动驱动的马尔可夫决策过程的概念并分析了其理论模型.另外,提出行动驱动的马尔可夫决策过程相关问题的求解算法,并在RoboCup仿真2D比赛的不离身带球问题中对算法进行了实验.实验结果表明,新算法使Agent的带球性能有了较大的提高.新算法已经用于中国科大“蓝鹰”仿真2D机器人足球队,并在比赛中取得了较好的效果. In order to solve a special kind of problem of Agent decision-making, this paper proposes the concept of action-driven Markov decision process and analyzes its theoretical model.In addition, it proposes a solution algorithm of action-driven Markov decision process related problems, The experimental results show that the new algorithm has greatly improved the performance of the agent’s ball-in-ball. The new algorithm has been used to simulate the “Lanying” 2D robot soccer team, and achieved good results in the competition.
其他文献
目的 观察用最大发射波长为800 nm近红外荧光量子点(quantum dots,QD800)标记的昆明小鼠鳞状细胞癌U14细胞在体内颊部的可视化成像情况,为癌症的早期诊断、可视化观察和个体
纳米材料在分子成像及肿瘤靶向治疗方面的作用越来越被重视,量子点由于具有丰富的表面化学性质和明亮稳定的荧光特性,被作为一种新型的纳米探针广泛地应用于分子、细胞及体内
目的:建立测定栀子金花丸中盐酸小檗碱和绿原酸含量的毛细管电泳法。方法:采用未涂层弹性融硅石英毛细管柱(60 cm×75μm ID,有效长度52 cm);分别以0.2 mol.L-1磷酸二氢钠溶
采用溶液聚合法合成了高固含量(>80%)聚醚醚酮(PEEK)改性酚醛树脂(PF),用非等温DSC(差示扫描量热)法和T-β(温度-升温速率)外推法对其固化反应动力学过程进行了研究,并根据Ki
循环塑性区大小是疲劳断裂研究中非常重要的一个参数.本文运用数值方法,考察了不同塑性本构模型、有限单元尺寸、几何非线性、载荷比等参数对于裂纹尖端疲劳塑性区大小的影响
制备以β-环糊精(β-CD)为主体,2,2′,5,5′-四氯联苯胺(TCB)为客体的固态包合物,通过核磁共振氢谱(~1H NMR)和红外光谱(FT-IR)分析了包合物的形成。利用紫外吸收光谱研究了
应用1D、2D NMR实验技术(1H NMR、13C NMR、DEPT、1H-1H COSY、1H-13CHMQC、1H-13C HMBC等)研究了靶向新药吉非替尼的结构,对其1H NMR和13C NMR谱峰作了全归属,并讨论了F原子
刻画了1类新的正则密码群并半群,即WrLR-拟正规密码群并半群.得到这类半群可以唯一地表示为某些完全单半群的特殊的WR型半格.同时考察了WrLR-拟正规带和WLR-拟正规纯正群并半
在基材表面或界面构筑高分子刷是目前材料表面修饰中一种具有广阔应用前景的方法。本文从高分子刷的定义及形成条件人手,归纳了基材或界面表面构筑高分子刷的主要方法以及在Si