Agent个体学习与多Agent协作的研究及其在RoboCup中的应用

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户：jg1983

【摘要】

：

近年来，有关多agent系统与分布式人工智能的研究，已经成为人工智能领域的重要研究方向之一。多agent系统以人类社会为参考目标，重点研究集体的智能行为。 RoboCup(robot worl

【作者】

：

王骋

【机构】

：

合肥工业大学

【出处】

：

合肥工业大学

【发表日期】

：

2004年期

【关键词】

：

RoboCup 机器学习多agent协作神经网络协作图

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来，有关多agent系统与分布式人工智能的研究，已经成为人工智能领域的重要研究方向之一。多agent系统以人类社会为参考目标，重点研究集体的智能行为。 RoboCup(robot world cup)，即机器人世界杯足球赛，是典型的多agent系统。人们通过对机器人足球赛的研究，探索多个机器人之间的合作与协调关系。机器人足球队为了能够完成实际的比赛任务，需要结合多种技术，包括自主机器人的设计、多agent的合作与协调、决策调度、实时推理、机器人学和传感技术等。RoboCup作为人工智能和机器人学新的标准问题，己受到越来越广泛的关注。在RoboCup中要想构建一支完整的球队，主要有两方面的工作：获得球员的个体动作以及在多个球员之间进行合作。本文就是从这两个方面展开研究。所谓的个体动作指的是由服务器提供的若干个动作命令组合起来实现的一个足球运动员的实际动作，比如射门、截球、传球等。本文重点研究两种神经网络算法：BP算法和RBF算法，使用这两种学习算法解决射门问题和传球问题。多个球员之间的合作属于多agent协作问题，即如何把所有球员有效的组织起来争取比赛的胜利。协作图是一种解决协作问题的新方法，它将全局的协作问题分解为若干个局部协作问题，大大减小了agent需要选择的动作空间。但是协作图要求离散状态变量，所以无法直接应用到类似RoboCup这种通讯条件受到限制的连续状态空间。为此，本文提出基于角色的协作图，并对协作图中用来计算联合动作的变量消减算法加以改进。在RoboCup中使用基于值规则的协作图实现了球员在对方禁区内的动作选择。

其他文献

工作流在企业信息化中的应用

随着信息技术的发展,"信息化带动工业化,工业化促进信息化"[1]己成为我国的战略任务.工作流技术是实现企业业务过程建模、业务过程优化、业务过程管理与集成,从而最终实现业

学位

工作流工作流管理系统工作流模型工作流过程定义语言

不一致弱可用数据的近似查询处理研究

数据质量是数据分析结论有效性和准确性的基础，也是最重要的前提和保障。造成数据质量问题的因素有很多，数据不一致性是其中的一个重要方面。在现实世界中，由于网络的普及，应用可

学位

一致性查询聚集操作一致性评估原型系统

织女星游戏网格设计与实现

随着网络游戏的飞速发展，网络游戏拥有越来越多的用户，同时在线的规模也越来越大，以棋牌类游戏为代表的在线游戏在高峰时期有几十万人的在线规模。现今的多人在线游戏(Multiplay

学位

多人在线织女星游戏网格消息通信客户端/服务器点对点

基于XML的P2P数据交换系统的研究与应用

随着Internet技术的高速发展,企业内部及企业之间的相互联系日趋加强,使得企业数据交换如同企业信息系统的动脉,高效而可靠的数据交换方式是企业提高商务效率、降低运作成本

学位

XMLP2P数据交换SOAP

RCD：一种精简的网络缓存内容摘要表达方法

网络缓存技术是一种把访问过的网络对象(网页、嵌入对象、流媒体等)暂存起来用于将来再次访问的网络技术。目前研究的重点已进入网络缓存协作的新阶段。网络缓存协作使更多的

学位

网络缓存代理缓存网络缓存合作缓存摘要

基于信息融合入侵检测技术研究

本文针对入侵检测系统展开了相关的研究。首先分析了入侵检测领域的当前发展状况、存在的问题。当前入侵检测系统的误报率高的主要原因是：仅仅由单一的检测手段得到的不完善的

学位

入侵检测证据推理信息融合可信度方法

半结构化文本信息抽取系统

作者的论文的题目是"半结构化文本信息抽取系统",该项目得到了国家自然科学基金、北京市自然科学基金的资助.该文是对研究和实现信息抽取系统所做的工作总结.Internet的发展

学位

信息抽取半结构化文本有监督的学习算法

煤矿低压电气设备综合试验装置的研究

低压电气设备综合试验装置是一套适用于煤矿车间使用的系统，可以完成三相异步电动机机械性能和电气性能的综合测试及井下低压防爆开关电气性能的试验。本文研究讨论了其相关软

学位

三相异步电动机低压防爆开关综合测试

工作流时态约束的管理框架研究

工作流管理系统WfMS(Workflow Management System)是近年来随着Internet和Intranet的普及而快速发展的软件系统之一。工作流管理系统的主要目标是通过调用有关信息资源与人力资源来协调业务流程中的各个环节，使之按照一定的顺序依次进行，从而实现业务流程的自动化。目前国内外虽然已经有了很多工作流管理系统的产品，但是大部分只能在设计阶段对工作流进行定义，并且工作

学位

工作流自适应软件时态约束协调机制

基于小波变换的鲁棒性与脆弱性数字水印算法的研究与实现

随着计算机网络、多媒体及信息科学的不断发展，数字媒体的产权保护已成为一个迫切需要解决的问题。但是传统的信息安全技术只能控制信息传播过程，对信息失真原因判断的模糊性，对

学位

数字水印鲁棒性内容认证HVSPKI

Agent个体学习与多Agent协作的研究及其在RoboCup中的应用

其他学术论文