基于对策论的机器人部队追捕问题研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:IT_Consultant
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文通过机器人部队(群机器人)追捕一个和多个猎物的过程来研究多个有限理性智能体在动态复杂环境下的最优合作机制与决策算法.具体研究以下几个主要方面:首先,提出多智能体追捕问题的Markov对策求解方案.针对多个并发的最优学习算法难以收敛的问题,这一部分首先引入了对策论的思想,将智能体看成是对策的局中人,将多智能体合作最优决策问题看成是多人对策,将对策的最优均衡局势作为多智能体系统的最优稳定解,从而解决了一致最优解的存在性问题.这样,通过设计合适的对策学习算法就能使对策各方达到一个共同的最优均衡,从而解决了收敛性问题.在此基础上提出了多智能体合作与协调问题的Markov对策求解思路,以此为基础,提出了追捕问题的Markov对策求解方案.其次,研究机器人部队捕获单个猎物的最优合作追捕算法.对于单猎物追捕问题,现有研究没有考虑追捕者和猎物的视野、速度、运动机会等各种条件都相同时的情况,也没有考虑团队追捕策略的最优性.针对这个问题,利用我们提出的单猎物追捕问题Markov对策求解方案和基于最佳响应动态的对策学习算法,这一部分我们首先实现了一种基于重复对策的静止猎物最优合作追捕算法.接着针对这一算法不能选择一致最优均衡的缺点,提出了一种可在对策结构未知条件下,通过重复对策进行关于一致最优均衡进行个性化协调选择的学习算法,以这个算法为核心实现了机器人部队捕获运动猎物的最优合作追捕算法.第三,研究机器人部队捕获多个猎物的最优合作追捕算法.对于多猎物追捕问题,现有的研究仅限于不同类型猎物静止和两个追捕者捕获两个猎物的简化模型这两种情况,没有研究多个不同类型猎物的随机出现、任意运动的最优追捕问题.针对这个问题,我们将多个不同类型猎物的追捕问题分解成选择猎物形成追捕联盟和各联盟分别最优追捕两步,在此基础上,这一部分我们首先提出了一种基于承诺的多猎物合作追捕算法.然而现有的对策论联盟算法和多智能体领域的联盟算法都只能形成静态联盟,这不能适应追捕这个动态的过程性任务.针对这个问题,我们提出了联盟生命值和违约金的概念,实现了允许退盟的动态联盟算法,并在改进的市场协调机制的基础上提出了一种基于动态联盟的机器人部队多猎物最优合作追捕算法.最后,实现了机器人部队包围/捕获猎物的仿真系统,该仿真系统包括有障碍物条件下的静止单猎物追捕、运动单猎物追捕和多运动猎物追捕三个主要部分.为验证算法的实际可行性,我们利用机器人足球比赛系统实现了足球机器人组成的概念性机器人部队包围/捕获猎物的由另一方足球机器人充当猎物的实际机器人部队追捕演示系统.
其他文献
时态数据库是日前数据库领域研究的热点,其具体实现技术以及在现实生活中的应用都具有非常重要的现实意义.目前基于有效时间间隔的时态数据表示模型已经比较成熟,而且被应用
本课题所研究的液压试验台计算机测控系统是对液压系统的高速信号进行捕捉并显示波形曲线的系统.课题针对液压高速信号的采集时机和技术进行了一些研究,开发了一个具有开放结
随着互联网的日益发展,现在使用的IPv4协议在地址数量、服务质量(QoS)和安全性等多方面已经不能够满足人们的要求.在这种背景下,IETF提出并制订了IPv6协议规范.在IPv4向IPv6
在信息时代,如何保证信息系统及时可靠地提供服务是信息主管部门必须面对的重大课题.随着计算机和网络技术的迅速发展,构建高可用系统,提供稳定、可靠、有效、持续运行的计算
复制机制被大量地应用到Internet中用来提高对Web文档的访问效率,并增强Web文档有效性、降低网络总流量、保持系统负载均衡的功能。大规模使用复制技术必须考虑两个关键问题:
宽带多业务接入网络可以在一个平台上提供多种类型的服务,相比单独建立多个专用业务类型的接入网络具有运营管理维护成本更低,网络铺设费用更低,灵活性更好和网络利用率更高的优
唇读是用计算机再现聋人通过唇动破解语言规律读懂语言的过程,这是一项非常具有挑战性的科学发现,同时也可以用作语音识别的一种辅助手段,以提高自动语音识别抗噪声能力.唇读
在数据网格中,为了在在范围内共享巨大数量的数据资源,提高系统的运行效率,提高数据访问的可靠性,优化数据访问的性能,必然要涉及大量数据文件的复制、传输.既然存在复制,那
Web服务作为新一代分布式技术,它的松散耦合性、跨平台、跨语言、良好的互操作特性已为许多专家拥护并得到广大 IT公司和组织的支持。Web服务技术的应用是全球网络化高速发展
该文在系统分析了现有的视频检索技术的基础上,提出了在场景层次上综合多模态信息来分析视频内容的方法.对多模态、场景的概念、多模态综合的理论和意义以及如何综合多模态来