群机器人追捕目标问题的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:n0131
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
群机器人追捕目标问题作为群机器人系统的一类典型协作问题,它研究的是一群机器人如何通过合作去有效地捕获另一群逃跑的机器人。群机器人追捕目标问题是研究多智能体机器人系统中有关群体机器人合作与协调、竞争与对抗的理想问题,它涵盖了实时视觉处理、无线通讯、实时动态路径规划、多机器人分布式协调与控制、多机器人规划与学习、机器人团队之间的竞争与合作等多学科、多领域知识。  本文在国家自然科学基金项目“基于多智能体协调的机器人系统控制”的资助下,依靠特定的问题背景以探索群体机器人的协作机制为导向,以提高群体机器人的协作效率为目的,对群机器人追捕目标的问题进行了系统深入地研究。主要包括如下几个方面:  第一,基于概率框架,深入研究了群机器人合作目标搜索问题。发现目标是追捕目标的前提,然而在群机器人追捕目标问题已有的工作中却鲜有这方面的研究成果。当目标的位置未知时,首要的问题应该是尽快地找到目标。为了有效地规划路径并搜索目标,本文基于概率框架首先研究了群机器人合作地图创建,提出了一种基于加权平均的群机器人地图融合算法。然后基于概率地图提出了几种启发式目标搜索策略,并给出了理论分析和详细的仿真试验。  第二,针对复杂、动态、开放的环境下群体机器人追捕多个目标的问题,本文首先对传统的合同网协议从三个方面进行了扩展:引入基于范例的推理以降低任务协商过程中的通信耗费;然后通过构造多属性招标决策框架以提高招标活动的科学和规范化;最后通过允许合同违约来提高系统的鲁棒性和动态优化的能力。在上述基础上,提出了一种群机器人追捕多个目标的任务分配算法,以实现群体机器人基于任务级的协作。  第三,有效的协作策略是群机器人追捕目标的核心研究问题。本文首先给出了两种单智能体强化学习算法,即决策树学习与Q-学习相结合的决策树 Q-学习算法以及基于资格迹的思想提出的在线利益分配学习算法,并进行了理论分析。然后提出了一种采用模块化学习结构、Q-学习与利益分配学习算法结合、并综合了对手建模技术的多智能体独立强化学习算法,以此为基础实现基于动作级的群机器人追捕目标协作策略。试验结果表明,该算法能够显著提高学习效率。最后,借鉴人类合作学习的特点,提出了一种基于策略共享的多智能体合作强化学习算法,用于提高群机器人协作追捕目标的效率。  第四,从基于行为的角度研究了在连续区域中群机器人追捕目标的问题。以基于运动图式的机器人反应式控制结构为基础,设计并实现了群机器人追捕目标的四种基本行为,即奔向目标行为、避开障碍物行为、避让队友机器人行为以及收缩包围行为。最后提出了一种基于行为控制参数自适应调整的机器人控制结构,以提高算法在复杂环境下的鲁棒性和任务完成效率。  第五,开发了群机器人协作追捕目标仿真平台,为深入研究群机器人追捕目标问题提供了一个标准的试验平台。该仿真系统采用模块化设计,便于对新的算法进行仿真研究,并通过各种试验对本文所提方法进行了验证。
其他文献
人脸识别研究的核心问题是使计算机具有身份辨别的能力。该研究具有重大的理论意义和实际应用价值。人脸识别技术的系统研究能够推动人工智能和计算机视觉等相关领域的发展。
智能运输系统(ITS)是当今信息技术领域的研究热点之一,地面交通管制是ITS 领域的一个子课题,其核心研究内容为如何构造高效率的信息系统来提高地面交通管制的效率。指挥中心
在目前众多的保证网络系统安全性的手段当中,入侵检测系统占有一个非常重要的位置。但是随着网络带宽的不断增高,网络数据流量逐渐加大,以往集中式的入侵检测系统往往有严重的丢
随着计算机及网络技术的快速发展,许多行业、单位和部门内部都逐步实现了业务、信息的计算机化管理,开发了大量软硬件平台各异的应用系统,在各种应用系统下又积累了丰富的数据资
无线传感器网络是由大量形体较小、能源受限并且配置有计算能力和无线通信能力的传感器节点以Ad Hoc方式组成。无线传感器网络高度自主性的特点使其广泛用于军事、环境监测等
随着网络技术的高速发展,Internet用户飞速增长,网络拥塞、服务器负载过重、访问延时过大等问题一直困扰着用户。CDN(Content Distribution Network内容分发网络)的出现极大
随着高校信息化建设的不断深入,作为高校后勤部门的重要组成部分的房产管理部门也急需一套辅助办公软件系统,使得他们能够从繁重的房产管理工作中解放出来。采用软件系统,不
随着企业网应用的不断发展,企业网的范围也不断扩大,从一个本地网络发展到跨地区跨城市甚至是跨国家的网络,企业如何利用现有的公共网络组建安全的企业内部网成为研究的一个热点
计算网格环境下基于多QoS约束的任务调度问题是目前网格任务调度算法研究领域的热点问题,存在克服资源异构性、协调管理策略分布性以及有效协同多QoS约束等难点。对这一问题
随着Internet的广泛应用和网络技术的迅速发展,网络主机数量呈指数级增长,可分配的IPv4地址即将枯竭,于是使用下一代互联网协议IPv6替代IPv4是解决地址不足问题的根本方法。