基于改进的Q算法的RoboCup防守策略研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:drhxumingzhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多智能体系统,是人工智能研究领域的热点问题之一。多智能体系统,运用各种人工智能理论,与实际的结合,能够模拟人类分工合作的智能行为,从而推动多智能体系统研究领域的发展。机器人世界杯(RoboCup),就是为了促进分布式机器人研究发展而成立的一个世界性竞赛和学术活动。RoboCup作为人工智能和机器人领域新的标准问题,具有多智能体系统的诸多特征,是各种新理论及技术的良好实验平台。其中,RoboCup仿真2D比赛项目,以多智能体系统决策为竞赛重点,为全世界各个多智能体系统理论学者提供了一个交流的平台。  本文利用时下被广泛应用Q-learning和数据提取及分析,对RoboCup仿真2D比赛所产生的日志文件进行数据提取和分析并保存,并将保存的数据用于改进的Q-learning算法的学习训练中,最后把改进Q-learning运用到RoboCup仿真2D比赛的防守中。  RoboCup仿真2D比赛的日志文件记录着比赛所有周期内球员和球的位置坐标、速度,以及球员的体力值、视野等各种属性,几乎将整个比赛的所有细节全部记录了下来,因此,我们可以通过调用日志文件回放比赛录像得到我们想要的数据。  在RoboCup仿真2D比赛中,将球远离自己家的禁区这是最能体现一支球队的防守。因为只有将球远离我方禁区之内,才是完美的防守,也正因为如此,所有球队的设计者在设计上都会尽可能的防止对方将球带入己方禁区之内。通常防守方的策略是通过截球或者铲球来阻止对方的球进入己方禁区。这也本文研究的重点。  本文从RoboCup仿真2D比赛的日志文件中,将有关防守动作和球的位置等重要信息进行数据提取并保存,然后使用改进的Q-learning对保存的数据进行训练,最后把该算法应用到球队。根据本文的研究结果指导球队性能的改善,最后通过比赛验证了该算法的可行性。
其他文献
目前,国内大中型烧结机都具备了过程检测和设备控制能力,当务之急就是研究和开发烧结过程控制方法,开发出我们国家自主知识产权的烧结过程自动控制系统。本文是基于日照钢铁控股
随着社会经济的不断发展,人们对于电子产品的需求也不断增加,使得各类电子产品不断的更新与发展,电子元器件也不断更新换代,电子连接器是其中一种重要的电子元器件。企业在生产了
近年来随着海上作业船舶需求量的增加及要求的不断提高,动力定位系统(DynamicPositioning System,简称DPS)作为重要的海上作业支持系统,其定位的精确性和稳定性要求也越来越高,现
从含铀浸出原液中提取得到铀合格液的生产过程,通常是在串联的数座吸附塔内完成。各路塔之间的树脂物位高度差是影响铀生产效率的重要因素之一。将各路塔中的树脂物位调整到同
随着科学的发展,世界的复杂性逐渐成为科学研究的中心。由于科学认识对象的复杂性、非线性、对称性和界限的模糊性等特性逐渐被纳入科学研究的领域,科学已经进入了一个新的发展
常规的最大功率点跟踪算法依赖条件较多,而且适用范围比较窄,常用于中小功率的风机上,难以满足机理复杂的非线性时变且具有大惯性的风力机系统。目前的这些常规算法对风能捕获的
据有关报道,在公路运输过程中每年由于包装件的损坏所造成的货物损失大约为140亿元,由此产生了相当大的经济损失。为了加强对运输过程的监督,减少货物损失,运输过程的检测越
近些年,多目标优化问题成为工业生产和生活中越来越需要面对和解决的问题,很多学者已经利用现有的优化算法解决了一些实际中的多目标优化问题。但是每一个算法都有自身的局限
我国股市虽然已经有20多年的发展历史,但是相比较欧美发达金融市场,我国金融市场还处于一个起步阶段。对比国外投资环境和交易者投资喜好,引入解释市场异象的情绪指数,对于新兴股
高炉炉温是高炉优质高产的重要参数,炉温过高或过低都不利于生产。炉温过高,会使焦比升高和生铁产量降低,引发悬料事故;炉温过低,会使炉内反应热量不足,导致高炉炉凉的发生。因此