强化学习在仿真足球机器人决策中的应用研究

来源 :长沙理工大学 | 被引量 : 0次 | 上传用户:fanyanbing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器人足球作为目前研究的一个热点课题,涉及人工智能、机器人学以及智能控制等多个学科领域。由于实体机器人足球比赛对比赛的硬件设备要求比较高,极大的限制了机器人足球比赛的发展。为了将各种智能算法更好的应用于机器人足球控制上,有必要开发足球机器人比赛的仿真平台。仿真平台所需设备简单,可以单纯从软件平台模拟实体比赛,所以足球机器人仿真比赛已成为足球机器人研究领域的一个重要分支。本文主要工作是将Sarsa学习算法应用于仿真足球机器人决策中,在MSRS 11vs11足球机器人仿真平台上对决策进行验证,并与其它几何学上的算法进行比较。由于仿真比赛的环境状态是一个复杂、连续的状态空间,在应用Sarsa学习算法之前,首先要对连续的状态空间进行离散化,离散化的好坏决定了足球机器人最终学习能否成功;其次是设计好奖赏函数和动作函数,奖赏函数的设计影响到学习算法的收敛性,动作函数直接影响到足球机器人动作的执行,间接影响到学习的效果;最后将两个几何学上的算法应用于仿真平台,记录相关的实验数据,将其与Sarsa学习算法进行比较,验证了Sarsa算法的有效性。
其他文献
随着IP技术和无线网络技术的快速发展,VoIP系统在得到迅猛发展的同时获得了极大普及。它的出现不仅降低了人们之间通讯的资费,丰富了通讯的形式,而且还提高了人们的生活质量。同
随着信息时代的高速发展,互联网平台上每天都会产生海量数据,如何从这些海量的数据中提取出有价值的信息具有重大的意义。Hadoop技术提出的HDFS和MapReduce技术解决了海量数据
机载数据总线技术是现代航空电子技术的关键技术之一,实现了航空电子各子系统之间、通用处理模块之间的资源共享,使航电系统构成了一个分布式的计算机网络,受到系统的集中显
MIMO系统是指收发端各自拥有多根天线的系统。在不增加带宽和发送功率的情况下,MIMO可以成倍地提高无线信道容量,改善系统性能,因此成为无线通信领域的关键技术之一。多用户M
随着信息科学技术的发展,特别是网络的飞速普及和3C(通信、消费电子、计算机)合一的加速,专业化和微型化成为发展的新趋势,嵌入式图像处理技术成为当前电子产品研发领域的热
同轴线作为一种常见的信号传输线,普遍地应用于各种射频系统中。通过在内外导体间的电介质层中填充铁氧体材料,并利用其相对磁导率与磁场相关的特点,可以将铁氧体同轴传输线作为
图像超分辨率重建(Super—Resolution Reconstruction,SRR),是指运用信号处理技术从一系列模糊、混有噪声的多幅低分辨率(Low—Resolution,LR)图像,来创建一幅或多幅细节更加丰富
无线传感器网络是一种特殊的Ad hoc网络,在很多方面都有着广泛的应用前景,无线传感器网络的独有特性,如:节点缺少物理保护,能量有限等,使其更易遭受攻击。到目前为止,无线传感
基于IEEE 802.16e的移动WiMAX(Worldwide Interoperability for Microwave Access)宽带无线接入技术具有数据传输速率高、部署简便等优点,其物理层采用了OFDM(正交频分复用)/
MIMO(Multiple-Input Multiple-OutPut)系统是未来宽带无线移动通信的关键技术之一,采用多天线技术来抑制信道衰落,利用MIMO技术极大的提高了系统的通信容量,在不增加带宽和