基于改进的Q学习的RoboCup传球策略研究

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:xqdd520cn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模拟机器人足球比赛(Robot World Cup,RoboCup)作为多Agent系统的一个理想的实验平台,已经成为人工智能的研究热点。传统的Q学习已被有效地应用于处理RoboCup中传球策略问题,但是它仅能简单地离散化连续的状态、动作空间。提出将神经网络应用于Q学习,系统只需学习部分状态一动作的Q值即可获得近似连续的Q值,就可以有效地提高泛化能力。然后将改进的Q学习应用于优化传球策略,最后在RoboCup中实现测试了该算法,实验结果表明改进的Q学习在RoboCup传球策略中的应用,可以有效提高传球的成
其他文献
[目的]对鸡致病性大肠杆菌耐药菌株进行分离和鉴定。[方法]对采自商丘市周边4个鸡场的粪样,进行大肠杆菌的分离,并对所分离的菌株进行生化鉴定,同时采用试纸片法对获得的大肠杆
针对民用建筑中用户配电网典型谐波源设备的分布和使用特点,分析其对电源质量环境的影响及设计解决方案。由于电子控制类设备的大量应用以及各次谐波在民用建筑中呈现时域性
[目的]研究选取稻飞虱为害后水稻叶片的有效特征波段,用于从大量成像光谱数据中快速识别和分类稻飞虱为害后的水稻叶片。[方法]实验采用多光谱成像系统对400-720 nm波段范围,每
文中针对语义网中同领域内的本体异构现象,以及无法实现领域内本体库共享的问题.提出利用人工智能研究中的机器学习算法来解决。通过概念匹配映射使异构本体的语义更好地得到映
服务发布和发现是Web服务应用中极其重要的环节。随着Web服务数目的增长和对实时性需求的增加,分布式服务发布和发现机制成为Web服务应用的一个新研究方向。对当前Web服务发现
[目的]构建小麦热激蛋白60(HSP60)基因的原核表达载体,并在E.coli中进行高效表达。[方法]根据GenBank中收录的小麦HSP60基因序列设计合成1对引物P1/P2,利用RT-PCR方法从小麦RNA
[目的]克隆颠茄(Atropa belladonna)H6H基因并构建高效植物表达载体。[方法]采用RT-PCR方法从颠茄(Atropa belladonna)中克隆莨菪碱-6β-羟化酶和1,4-丁二胺-氮-甲基转移酶基因编
糯米不仅是一种众所周知的粮食,也是一种重要的保健药材,还是一种重要的工程材料,资源丰富。糯米淀粉主要由枝链淀粉组成,淀粉颗粒呈多面体,糯米具有优良的韧性、防渗性、黏
基于非Gaussian噪声线性定常控制系统,通过控制滤波器输出残差或状态估计误差的条件概率密度函数形状来建立有效的滤波设计算法,创建滤波器输出残差或状态估计误差的条件概率密