【摘 要】
:
多智能体协作是目前分布式人工智能领域的一个重要的研究热点。RoboCup仿真组的比赛是研究多智能体协作问题的一个标准的理想平台,它模拟了人类足球比赛,要想在这个复杂的多
论文部分内容阅读
多智能体协作是目前分布式人工智能领域的一个重要的研究热点。RoboCup仿真组的比赛是研究多智能体协作问题的一个标准的理想平台,它模拟了人类足球比赛,要想在这个复杂的多智能体环境中赢得比赛胜利,必须要经过智能体之间的协作。本文在仿真球队的设计中,应用学习、预测技术设计了多智能体的协作策略和模型,主要研究工作有:首先,针对智能体之间协作策略的问题,提出了基于多维CMAC网络的多智能体Q学习算法。该算法通过对传统动作的学习增加智能体之间的协作,并在传统Q学习的基础上,采用了CMAC网络来储存每个动作的Q值表,该方法不仅提高了Q学习的泛化能力,而且提高了学习速度和精度,并将该方法成功的运用到RoboCup中多智能体协作的离线学习中,解决了RoboCup中的一个典型的子问题:2VS1问题。其次,针对智能体数目较多的时候,为了提高多智能体的整体协作能力,提出了一种基于行为预测的多智能体协作模型,使协作模型设计简单、反应速度快、适应性好和智能度较高,通过对行为预测和动作预测的结合,提高多智能体的协作能力。采用基于行为预测法的协作模型运用RoboCup仿真组比赛中,实现了球队的协作决策。最后,针对多智能体的整体设计依靠人工实现的复杂性,以及预测的准确度对协作策略的形成影响较大的原因,在预测模型中加入了学习模块,提出了基于预测的Q学习方法,它结合了Q学习算法和预测技术,提高了智能体的在线学习能力。并将该方法运用到3VS4的试验中,验证了它的有效性。通过在仿真球队中应用实践,验证了论文提出的多智能体协作策略和模型的有效性。
其他文献
基于GPRS和GIS的自动售货机监控管理系统是集成了GPRS无线通信技术、地理信息技术、数据库技术等于一体的网络化服务管理系统。本系统通过GPRS无线通讯模块将售货机底层控制
煤岩声发射监测是一种很有发展前途的连续检测煤矿动力灾害的方法。本文以导师的山东省科技发展计划项目“基于小尺度传感器阵列的煤岩声发射监测系统研究”为研究背景,旨在研
雷达发射机作为雷达系统的核心组件,其工作性能的稳定性和可靠性对雷达系统有着重大的影响。为提高雷达发射机的可靠性、稳定性,发射机自动检测系统成为雷达发射机设计过程中一
纵列式双旋翼直升机是典型的多变量、强耦合、不稳定的非线性系统。若不采用飞行控制,其根本无法达到军用旋翼机操纵品质标准ADS-33的性能指标要求。本文以纵列式双旋翼直升机
煤矿井下的粉尘不仅严重影响着煤矿的安全生产,而且对矿工身体健康构成危害,研究粉尘浓度的测量方法对粉尘防治具有重要的意义。针对煤矿井下粉尘测量中存在的问题,研究了一种基
随着经济的高速发展,环境和能源问题日益加剧。风能作为一种无污染、可再生能源,已经受到了世界各国的普遍重视。风力发电技术已经成为全球学者研究的热点。风力机是风力发电机组中两大组成部分之一,它负责将风能转化为机械能,因此对风力机进行研究具有很好的现实意义。本文首先在研究风速特性后建立了组合风速模型,基于叶素理论和涡流理论建立了风轮模型,选用刚性轴模型建立了传动系统的数学模型,用随动系统模拟了变桨距系统
立体视觉是计算机视觉领域的一个重要研究课题,旨在重构场景的三维几何信息,在机器人视觉导航、工业自动化、航空勘测、近距照相测量等领域都具有很好的应用价值。其中双目立体
随着我国市场经济的持续发展,家电产品的消费需求也不断增强,再加上近期国家实行“家电下乡”的优惠政策,给家电销售企业带来了新的发展机遇。家电市场是一个完全竞争的市场,
本论文是全景立体球视觉系统的子系统—基于DSP的图像处理系统设计。本文根据全景立体球视觉总系统对该图像处理系统的功能需求,提出图像处理系统的总体设计方案。为系统进行
本文主要研究基于深度轮廓波卷积神经网络的遥感图像地物分类问题。深度卷积神经网络是一种可以直接处理图像块的前馈神经网络,能够引入像素空间相关性,减弱相干斑影响、提升分类精度。将深度卷积神经网络延拓至复数域进行运算,可充分利用遥感图像的相位信息,构造得复数卷积神经网络。轮廓波变换用不同尺度上的不同方向的子带来逼近图像,能更好的捕捉图像的内部几何结构,获得判别特征。以复数卷积神经网络为基础,引入轮廓波变