RoboCup仿真环境下Agent机器学习策略的研究

被引量 : 2次 | 上传用户:klzvms1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
RoboCup(机器人世界杯足球赛)是国际上规模最大、影响最为广泛的机器人足球赛事,它是人工智能和机器人研究的一种集中体现。在RoboCup的仿真环境下,机器学习的很多方法都可以得到检验。作为人工智能和机器人学新的标准问题,机器人足球受到越来越广泛的关注。本文使用仿真机器人足球作为研究机器学习算法应用的载体,基于Agent和机器学习的理论,围绕Agent个体的基本动作及Agent个体高级动作的决策问题展开研究,主要研究内容和成果如下:1.将强化学习的方法引入到Agent踢球动作中,实现了把球加速到指定的出球速度的目的;在简化条件下采用BP神经网络的方法拟合Agcnt踢球力量和速度的关系,以便应用到简单的踢球动作的选择中。2.改进现有的神经网络的截球方法,构造出一种新的基于BP神经网络的截球动作模型,并将该模型直接应用到传球的判断中,实现了传球路线的选择;将RBF神经网络引入到射门模型中,根据强化学习和BP神经网络结合的思想提出了一种新的基于前向神经网络的Q学习的算法,较好的实现了射门模型。
其他文献
在全球范围内,并购已经成为企业扩大规模、增强实力、提高效率的重要手段。伴随着中国入世的实现,中国的并购也进入了WTO时代。不仅境外企业为进入中国市场而长驱直入并购国内
目的观察蒙脱石散(思密达)联合金双歧片治疗小儿急性腹泻的临床效果。方法选取2010年11月~2011年11月间入院治疗的64例急性腹泻患儿为研究对象,根据实施治疗的方法不同随机分
赣南客家人在漫长的茶事劳动基础上,创造出了特色鲜明的采茶舞蹈,其以鲜明的人物形象、诙谐的语言和朴实的生活内容为基础,通过形式多样、形象鲜明、诙谐幽默的歌舞为艺术表
广东省凭借其特殊的地理位置和中央赋予的政策优势,已经成为中国经济增长最快、对外贸易最发达、投资环境最具吸引力的地区之一。在广东经济发展过程中,基础建设起到了重要的支
为研究导叶可调式液力变矩器的内部流动特性,以循环圆直径为320 mm导叶可调式液力变矩器作为研究对象.采用计算流体动力学(CFD)方法对其不同开度、不同工况下的内部流动状态
<正>安徽宿州同创食品机械有限公司生产的TCJX-75型分离式挤馅机,采用模块化设计,使用方便,具有拆卸简单、清洗容易等特点。可根据不同产品的需
随着内蒙古零售业的进一步发展与成熟,零售业之间的竞争开始步入白热化阶段。为了获得生存与发展,零售店不得不努力提升自己的核心竞争力。本研究认为,动态能力能集中体现零
近年来,火灾事故频发,给人们的生命和财产带来巨大的损失。随着火灾发生原因的多样化,社会对火灾事故调查技术的要求越来越多。基于此,本文从近几年来火灾事故调查的难题出发
藏品账目是国家的科学文化财产账,是国家科学文化财产的法定文献依据。藏品账目的传统管理基本都是通过手工完成的,随着计算机网络技术和信息技术的发展,藏品账目管理模式逐
本文对国外基于传感器的物联网智能物流进行了理论研究,并在此基础上对联邦快递基于无线传感器的物流跟踪系统进行了应用分析。