基于改进的Q学习的RoboCup传球策略研究

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户：xqdd520cn

【摘要】

：

模拟机器人足球比赛（Robot World Cup，RoboCup）作为多Agent系统的一个理想的实验平台，已经成为人工智能的研究热点。传统的Q学习已被有效地应用于处理RoboCup中传球策略问题，但是

【作者】

：

周勇刘锋

【机构】

：

安徽大学计算机科学与技术学院

【出处】

：

计算机技术与发展

【发表日期】

：

2008年4期

【关键词】

：

ROBOCUP 神经网络 Q学习智能体传球策略 RoboCup neural network Q-learning agent pass strat

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

模拟机器人足球比赛（Robot World Cup，RoboCup）作为多Agent系统的一个理想的实验平台，已经成为人工智能的研究热点。传统的Q学习已被有效地应用于处理RoboCup中传球策略问题，但是它仅能简单地离散化连续的状态、动作空间。提出将神经网络应用于Q学习，系统只需学习部分状态一动作的Q值即可获得近似连续的Q值，就可以有效地提高泛化能力。然后将改进的Q学习应用于优化传球策略，最后在RoboCup中实现测试了该算法，实验结果表明改进的Q学习在RoboCup传球策略中的应用，可以有效提高传球的成

其他文献

鸡致病性大肠杆菌耐药菌株分离与鉴定

[目的]对鸡致病性大肠杆菌耐药菌株进行分离和鉴定。[方法]对采自商丘市周边4个鸡场的粪样，进行大肠杆菌的分离，并对所分离的菌株进行生化鉴定，同时采用试纸片法对获得的大肠杆

期刊

鸡大肠杆菌药敏试验耐药性Chicken Escherichia coli Drug sensitivity test Drug resistanc

谐波源设备对用户配电网电源影响分析和绿色设计探讨

针对民用建筑中用户配电网典型谐波源设备的分布和使用特点,分析其对电源质量环境的影响及设计解决方案。由于电子控制类设备的大量应用以及各次谐波在民用建筑中呈现时域性

期刊

谐波源预防性滤除谐波损耗电气绿色设计harmonic sourcepreventive filtrationharmonic lossgreen

基于多光谱成像技术选取稻飞虱为害后水稻叶片的特征波段

[目的]研究选取稻飞虱为害后水稻叶片的有效特征波段，用于从大量成像光谱数据中快速识别和分类稻飞虱为害后的水稻叶片。[方法]实验采用多光谱成像系统对400-720 nm波段范围，每

期刊

特征波段多光谱成像受胁迫的水稻叶片稻飞虱分类精度Feature bands Multi-spectral imaging Damaged rice

机器学习在本体映射中的应用

文中针对语义网中同领域内的本体异构现象，以及无法实现领域内本体库共享的问题．提出利用人工智能研究中的机器学习算法来解决。通过概念匹配映射使异构本体的语义更好地得到映

期刊

语义WEB机器学习算法决策树算法分类树概念映射semantic webmachine learning algorithm decision tr

一种基于P2P的语义Web服务发布和发现模型

服务发布和发现是Web服务应用中极其重要的环节。随着Web服务数目的增长和对实时性需求的增加，分布式服务发布和发现机制成为Web服务应用的一个新研究方向。对当前Web服务发现

期刊

语义WEB服务P2P本体semantic Web service P2P ontology

小麦热激蛋白60（HSP60）基因的克隆与原核表达（摘要）（英文）

[目的]构建小麦热激蛋白60（HSP60）基因的原核表达载体,并在E.coli中进行高效表达。[方法]根据GenBank中收录的小麦HSP60基因序列设计合成1对引物P1/P2,利用RT-PCR方法从小麦RNA

期刊

HSP60基因克隆原核表达HSP60 Gene cloning Prokaryotic expression

颠茄H6H基因的克隆及高效植物表达载体的构建（摘要）

[目的]克隆颠茄（Atropa belladonna）H6H基因并构建高效植物表达载体。[方法]采用RT-PCR方法从颠茄（Atropa belladonna）中克隆莨菪碱-6β-羟化酶和1,4-丁二胺-氮-甲基转移酶基因编

期刊

颠茄莨菪碱-6β-羟化酶高效植物表达载体Atropa belladonna Hyoscyamine 6β-hydroxylase Plant expr

Suitable Date of Seeding, Planting Density and Water Use Efficiency for Propagation of Stock Seed Po

期刊

水分利用效率种植密度播种日期马铃薯种薯马铃薯产量繁殖股票山区Date ofseedingi Planting density Stock se

糯米的工程特性及应用研究

糯米不仅是一种众所周知的粮食,也是一种重要的保健药材,还是一种重要的工程材料,资源丰富。糯米淀粉主要由枝链淀粉组成,淀粉颗粒呈多面体,糯米具有优良的韧性、防渗性、黏

期刊

糯米生态材料工程应用风景园林Sticky rice Ecological material Engineering application Arc

非高斯噪声下输出残差或状态估计误差的熵研究

基于非Gaussian噪声线性定常控制系统，通过控制滤波器输出残差或状态估计误差的条件概率密度函数形状来建立有效的滤波设计算法，创建滤波器输出残差或状态估计误差的条件概率密

期刊

输出残差熵非高斯噪声条件概率密度函数Kalman滤波方法output residuals entropy non - Gaussian noise

基于改进的Q学习的RoboCup传球策略研究

与本文相关的学术论文