论文部分内容阅读
近年来,有关多agent系统与分布式人工智能的研究,已经成为人工智能领域的重要研究方向之一。多agent系统以人类社会为参考目标,重点研究集体的智能行为。 RoboCup(robot world cup),即机器人世界杯足球赛,是典型的多agent系统。人们通过对机器人足球赛的研究,探索多个机器人之间的合作与协调关系。机器人足球队为了能够完成实际的比赛任务,需要结合多种技术,包括自主机器人的设计、多agent的合作与协调、决策调度、实时推理、机器人学和传感技术等。RoboCup作为人工智能和机器人学新的标准问题,己受到越来越广泛的关注。 在RoboCup中要想构建一支完整的球队,主要有两方面的工作:获得球员的个体动作以及在多个球员之间进行合作。本文就是从这两个方面展开研究。 所谓的个体动作指的是由服务器提供的若干个动作命令组合起来实现的一个足球运动员的实际动作,比如射门、截球、传球等。本文重点研究两种神经网络算法:BP算法和RBF算法,使用这两种学习算法解决射门问题和传球问题。 多个球员之间的合作属于多agent协作问题,即如何把所有球员有效的组织起来争取比赛的胜利。协作图是一种解决协作问题的新方法,它将全局的协作问题分解为若干个局部协作问题,大大减小了agent需要选择的动作空间。但是协作图要求离散状态变量,所以无法直接应用到类似RoboCup这种通讯条件受到限制的连续状态空间。为此,本文提出基于角色的协作图,并对协作图中用来计算联合动作的变量消减算法加以改进。在RoboCup中使用基于值规则的协作图实现了球员在对方禁区内的动作选择。