【摘 要】
:
近年来,机器人足球项目逐渐发展为人们研究人工智能理论和机器人学科的主要方向。由于实体机器人价格昂贵,而RoboCup2D仿真足球项目同时也包含了机器人足球的主要技术。RoboCup2D融合了多智能体决策、通信和信息获取等原理与技术,目前主要用手工决策和智能算法来解决球员智能体决策的问题。本文在对RoboCup2D仿真系统建模的基础上,重点研究机器人智能体的策略、协作决策和球队的阵型站位等内容,主要
论文部分内容阅读
近年来,机器人足球项目逐渐发展为人们研究人工智能理论和机器人学科的主要方向。由于实体机器人价格昂贵,而RoboCup2D仿真足球项目同时也包含了机器人足球的主要技术。RoboCup2D融合了多智能体决策、通信和信息获取等原理与技术,目前主要用手工决策和智能算法来解决球员智能体决策的问题。本文在对RoboCup2D仿真系统建模的基础上,重点研究机器人智能体的策略、协作决策和球队的阵型站位等内容,主要研究工作包括:(1)利用手工决策的方式对球队的攻防策略进行优化,提出一种多人防守和守门员防守策略以及三角进攻策略。多人防守策略是当对方处于进攻状态时,我方派出两名及以上队员去逼抢对方持球队员。守门员防守策略分为主动出击和预测球的位置。三角进攻策略是通过三名队友在适当位置的跑位配合来实现的,由一名核心进攻球员和两名辅助进攻球员组成三角进攻小组。将改进策略应用到球队中,并在Robo Cup仿真2D系统上与XUPL-LMZ、Wright Eagle、UVA等球队进行比赛测试,相比于初始球队Agent2Dbase获胜场次增加率为53.3%、70%和81.8%,验证了该策略的有效性和实用性。(2)针对球员之间动作协作决策效率低的问题,提出一种基于资格迹(Eligibility Traces)的Q-learning(η)算法的进攻与防守协作机制。主要通过设计球员在球场不同区域的状态变量、动作函数和奖惩值来加快球员Agent学习达到稳定状态的速度,同时解决了球员传球和截球效率低的问题。其中动作函数包括核心进攻球员、普通防守球员以及守门员,奖惩值包括球场基础奖惩值和球员之间的奖惩值。将三种算法Q-learning(η)、Q-learning、Sarsa应用到RoboCup2D中进行学习对比,球员的传球成功率相比于初始球队分别提高了16%、9%、6%,球员的截球成功率分别提高了13%、8%、6%。仿真实验证明了Q-learning(η)算法收敛速度较快,并可有效提升球员Agent的攻防协作决策能力。(3)针对Fedit2阵型编辑器不能从整体和对比的角度去分析场上球员在球场中不同区域的站位,提出利用Petri网理论模型来对阵型进行建模分析。重点通过双方球员的持球情况和球在球场中位置建立并分析阵型转换的Petri网模型,由于球队守门员选用的是静态分区的方式,即守门员的站位与阵型的变化无关,因此单独对守门员的站位进行Petri网建模。最后用可达图和仿真软件HPsim对Petri网模型的各种特性进行分析,从理论和仿真方面验证了所建阵型转换和守门员站位模型结构的正确性,并在RoboCup2D比赛中进行测试,通过与初始球队使用的Delaunay三角剖分方法相比,加入Petri网分析阵型的球队的传球次数增加,场均丢球数减少,最后通过球员的跑位数据对比进一步验证了Petri网模型对球队阵型分析的高效性。
其他文献
<正>2023年中考即将来临,考场作文要想获得高分,就必须使尽浑身解数,以吸引阅卷老师的眼球。那么,怎样在有限的时间内用最有效的方法赢得最多的分数呢?可从以下五个方面努力:一、立意要高远新颖中考作文题都注重引导考生弘扬健康阳光、积极向上的正能量,凸显立德树人的价值导向。作文试题不仅考查考生的文字表达能力,更考查考生的三观、对世界认识的广度和深度。因此,立意是否正确、新颖、高远、深刻无疑是拉开作文档
系统地分析了唐山地震前后34期的重力测量数据,讨论了地面沉降、采矿和地下水位变化对重力观测的影响.论证了观测资料的可靠程度,并在此基础上结合地质构造、形变测量和测震结果分析了重力变化的物理机制,讨论了这次强烈地震前后重力变化的全过程,演绎出3个特征阶段重力变化的物理机制:①1971~1975年期间,震区附近区域重力场具有显著的上升趋势,它与莫霍界面的上隆有关;②1975~1976年期间,根据形变、
当前,网络安全已成为媒体深度融合发展的关键一环。大众报业集团网络安全保障调研小组通过梳理集团网络安工作成效和现状,总结出报业集团网络安全工作在新情况下的解决思路,以促进报业集团持续更新网络安全防护体系。
地裂缝是一种典型缓变型地质灾害,其对城市道路、桥梁、地下管道以及建筑结构都会造成不同程度的破坏,其中又以地表建筑破坏尤为显著。西安处于构造活动强烈的汾渭盆地,地震频发。而已有研究表明,地震作用下,地裂缝的存在会放大其附近土体的地震响应,这使得处于地震放大效应影响范围内的建筑可能面临安全隐患,但现行规范《西安地裂缝场地勘察与工程设计规程》(DBJ61-6-2006)和《建筑抗震设计规范》(GB500
创业是新时代经济发展的动力之一,但创业也是极具风险性的行为,如何使创业团队做出正确的决策是创业团队存活的重中之重。因此,探索创业团队中团队决策绩效的提升具有重要价值。本研究以社会交换理论和社会认知理论为基础,以大学生“挑战杯”创业大赛团队为对象,运用实证分析的方法,探讨在创业团队中交互记忆系统对团队决策绩效的影响机制。基于72个团队267份问卷数据的实证分析结果显示:交互记忆系统有效提升了团队主动
土耳其导演努里·比格·锡兰被誉为二十一世纪世界影坛最受瞩目的艺术片导演之一,也是当今世界最具个人影像风格的导演之一,这位来自土耳其的电影人在迄今为止二十余年的导演生涯里,仅拍摄9部电影,却收获国内外多个奖项的肯定。无论是主题生发还是影像呈现,其作品都呈现出一以贯之的独特美学风格。从回望故乡琐细生活的情感迸发,到城市化进程中对人们生存状态的担忧,再到对社会问题的深切关注,既是锡兰个人成长的记录,也是
约谈提醒作为监督执纪“四种形态”的第一种形态,不仅是纪检监察机关强化日常监督的重要手段,还是社会生产生活中一种具有针对性的谈话形式。约谈记录作为一种记录约谈情况供后续回溯查阅的公文,利用文本处理技术自动生成约谈记录及其摘要,将助力实现智能约谈。但约谈过程中对话主题不明显、重点不突出等特点导致约谈记录摘要自动生成工作开展困难。本文主要工作包括:1.针对语音转写后多主题、多段落混合的约谈记录,提出了一
我国的优秀传统文化对教育资源有着深厚的影响,对小学生的思想道德教育有着极大的推动作用。特别是十九大以来,国家大力倡导弘扬中华优秀传统文化,着力推进民族文化自信的培养,因此,优秀文化的传承就要从小学生抓起。本文就对如何在传统节日中开展礼乐文化活动进行研究,以供参考。