基于多智能体强化学习的勤务保障指挥调度方法

来源 :指挥控制与仿真 | 被引量 : 0次 | 上传用户:xiongxiaoxue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在时、空、资源受限的复杂勤务保障场景中,实现动态、高效且可靠的勤务保障组织指挥调度,对于提升大型舰船平台飞机出动能力至关重要。通过分析飞机勤务保障指挥调度任务特点,建立多机、多保障作业并行执行的勤务保障指挥调度马尔科夫决策过程,将多智能体技术与强化学习深度结合,构建多智能体深度确定性策略迭代模型,自动生成保障计划。经仿真实验验证,所提出的勤务保障指挥调度方法,能有效满足飞机勤务指挥调度优化需求。
其他文献
针对电网在台风、冰冻等极端条件下发生故障的诊断问题,提出利用标准遥信及广域测量系统(wide area measurement system,WAMS)数据训练Alexnet模型,并应用于电网故障诊断的方案。首先利用标准故障遥信信息和WAMS数据构造Alexnet的输入图片矩阵,对Alexnet进行训练。然后对Alexnet输入图片高维特征提取方法进行分析,提出构造最优分布结构的输入图片矩阵方法,
在驱傩仪式中,驱傩主角首先由兽类充当。随着人类在驱傩叙事中主体地位的日益凸显,驱傩主角又逐渐演变为由人类和兽类共同充当,直至最后完全由人类本身充当。傩面具造型也相应地呈现出从“兽面造型”到“半人半兽造型”、再到“人面造型”的发展趋势。其文化动因在于:傩面具赋予了巫师穿越不同世界的跨世界同一性,是巫师往返于现实世界与可能世界之间的可通达渠道;它在造型上与人面面具的相似度越大,驱傩可能世界与现实世界的
系统测试是在系统投入使用前,对整体系统的各功能模块及各要素之间进行使用情况审核的测试。论文从系统测试的概述出发,以某招标系统的测试为例,从功能测试以及非功能测试两个方面对系统进行测试,给出了系统测试用例。
钙拮抗剂又称钙通道阻滞剂,是高血压治疗中一类非常重要的药物,与利尿剂、β受体阻滞剂、血管紧张素转化酶抑制剂(ACEI)、血管紧张素Ⅱ受体拮抗剂(ARBs)并列于我国高血压治疗的五大类一线降压药物。相关资料显示,我国有一半以上服药治疗的高血压患者在应用钙离子拮抗剂。钙拮抗剂可分为二氢吡啶类和非二氢吡啶类,前者如硝苯地平片,其药名末尾均带有“地平”两字,俗称“地平类”降压片;后者如维拉帕米、地尔硫艹卓
期刊
本文基于PX4飞控的四旋翼无人机在Gazebo仿真环境中进行强化学习训练的相关研究中,需要解决强化学习与仿真环境交互接口问题。本文首先介绍了PX4飞控、外部程序、Gazebo仿真环境相互间的交互方式,然后介绍了用于无人机自主着陆控制问题研究的强化学习基本模型。为了有效支撑强化学习训练,重点研究了基于Gazebo和PX4的无人机仿真环境接口程序的设计与实现方法。经实验验证,该方法编写的接口程序能够顺
在卫星通信系统中,频率和信道是十分珍稀的资源,针对如何利用可靠且高效的方法来进行资源的开发这一亟需解决的难题,提出了一种基于Q-learning深度强化学习的动态卫星信道分配算法DRL-DCA,该算法将卫星和环境交互建模为马尔科夫决策过程,通过环境的反馈提升卫星的决策能力,实现用户业务请求的高效应答,提升卫星通信的服务质量,降低通信阻塞发生概率。仿真分析表明该算法能够有效地提升通信的吞吐量,降低通
针对深度强化学习算法在多对多近距空战决策过程中存在难以处理高维状态空间、难收敛等问题,提出一种基于注意力机制的近端策略优化算法。在经典的近端策略优化算法基础上引入注意力的思想,通过构造基于空战威胁度的注意力模型,对多机作战的空战态势信息进行注意力分配与信息聚合,使算法不用直接处理高维状态空间。2V2近距空战仿真实验结果表明,在初始状态为优势和劣势的情形下,基于注意力机制的近端策略优化算法训练的模型
Obstacle avoidance becomes a very challenging task for an autonomous underwater vehicle(AUV) in an unknown underwater environment during exploration process. Successful control in such case may be ach
期刊
目的:分析高龄高血压患者使用苯磺酸氨氯地平片治疗后,对患者肾功能、血压控制水平的影响。方法:选取2019年6月-2020年5月中国地质大学(武汉)医院收治的高龄高血压患者作为研究对象,共100例。均采用苯磺酸氨氯地平片治疗,对比患者治疗前后的肾功能、血压情况。结果:治疗后尿微量白蛋白、血尿β2-微球蛋白及尿β2-微球蛋白指标指低于治疗前,部分患者达到了正常范围,差异具有统计学意义(P<0.05);
无人车(UGV)可替代人类自主地执行民用和军事任务,对未来智能交通及陆军装备发展有重要战略意义。随着人工智能技术的日益成熟,采用强化学习技术成为了无人车智能决策领域最受关注的发展趋势之一。本文首先简要概述了强化学习的发展历程、基础原理和核心算法;随后,分析总结了强化学习在无人车智能决策中的研究进展,包括障碍物规避、变道与超车、车道保持和道路交叉口通行四种典型场景;最后,针对基于强化学习的智能决策面