【摘 要】
:
作为一种典型的无人作战形式,多无人机对抗复杂多变、不确定强,一直是军事领域的研究热点。本文通过空战任务分析、多智能体系统建模、多无人机空战仿真等方法,对面向多无人机对抗任务的深度强化学习方法开展了研究。本文的研究内容主要包括:1、阐述了多无人机对抗任务的知识背景与研究价值。对多智能体深度强化学习算法与其应用领域进行了详细介绍,并将其感知与决策能力应用在多无人机协同空战,提出了面向多无人机对抗任务的
论文部分内容阅读
作为一种典型的无人作战形式,多无人机对抗复杂多变、不确定强,一直是军事领域的研究热点。本文通过空战任务分析、多智能体系统建模、多无人机空战仿真等方法,对面向多无人机对抗任务的深度强化学习方法开展了研究。本文的研究内容主要包括:1、阐述了多无人机对抗任务的知识背景与研究价值。对多智能体深度强化学习算法与其应用领域进行了详细介绍,并将其感知与决策能力应用在多无人机协同空战,提出了面向多无人机对抗任务的深度强化学习方法。2、针对深度强化学习算法在多无人机对抗任务中存在的训练困难、生成的模型能力差等问题,提出了两种训练优化技术。场景迁移技术能够利用智能体在简单场景下获取的经验帮助在复杂场景中的训练。自我博弈技术是让智能体通过对抗与自己能力相同的对手来提高能力。3、无人机对抗领域中存在着丰富的人类经验。本文提出了规则耦合强化学习方法,将人类经验抽象为战术规则,并使用战术规则指导智能体的学习过程。该方法能够减少无效探索来提高训练速度和智能体的能力。4、针对深度强化学习算法在复杂的多智能体环境中计算资源耗费大、收敛速度慢的问题,本文提出了一种多智能体深度强化学习并行方法。将多智能体深度强化学习的训练过程并行化,有利于快速修正超参数,能够充分利用计算资源,降低训练所需时间。
其他文献
在气象领域,锋面是一类温度水平梯度比较大的区域,由于其斜压性大,有利于垂直环流的发展与能量转换,因而锋面附近常有比较剧烈的天气变化和气压系统的发生和发展,因此锋区和锋线的分析是天气分析主要内容之一,在天气分析中占有非常重要的地位。目前锋面分析还主要还是依靠人工分析,而已有的锋面自动识别主要是根据单一要素来进行分析和识别的。本文针对单一要素锋面自动识别时容易出现误判、漏判的情况,开展了基于多元回归的
工业无人机能够完成作业,实现功能,飞行可靠性至关重要。无人机在实际工作环境中遇到的外界干扰主要是GNSS干扰和磁干扰。针对这两种干扰,本文基于无人机多传感器组合导航算法进行了深入研究,提出了对干扰环境中多传感器组合导航技术进行优化方法,以提高干扰发生时无人机的飞行可靠性,并设计了实验进行验证。论文主要完成了以下工作:1.提出了一种两路GNSS数据的融合算法。本文使用了两路多频GNSS接收机,一路带
足式机器人相对于传统轮式机器人最大的优越性在于对复杂地形环境具有更好适应性,为实现对复杂环境的适应,四足机器人通过自身姿态传感器以及足端接触力传感器、以及视觉传感器结合机器人运动学获取支撑面坡度信息,并据此通过调整机器人各腿平衡位置的方式改变机器人的腿长,使机器人重心投影基本处于支撑面中心位置以保持身体稳定,也通过腿长的变化适应起伏的地面同时完成上坡上台阶的运动达到环境适应的目的。本文基于Hopf
习近平总书记在2015年9月提出"中华民族共同体意识"。加强中华民族团结,长远和根本的是增强文化认同,建设各民族共有精神家园,积极培养中华民族共同体意识成为社会各界的共识。中国的多民族文学研究应该如何回应这一新时代目标?本期刊发一组"中华民族共同体的理念导向与民族文学功能"笔谈文章,从民族文学功能角度提出了"民族文学的特殊使命——铸牢中华民族同体意识",正是对这一时代命题的深入解读。
空中飞机目标按照工作原理和用途可以分为直升机、螺旋桨飞机、喷气式飞机三种。这三种空中飞机目标雷达回波信号主要包括机身分量和旋转部件微动分量。分离飞机目标雷达回波信号中的微动分量并进行微动特征提取与识别,这两项研究受到国内外学术界和工业界的广泛关注,在军事和民用领域都具有重要的应用价值。对于飞机目标识别,传统特征提取方法需要更多的人工操作,不仅耗费时间和精力,且因为人工经验抽取信号特征是随机过程,会
某新型复合型传感器作为车载故障诊断系统的关键信息采集部件,主要功能是监测列车各轴承、齿轮等测点的温度、振动、冲击信号,一般安装在车下,其承受的各方面的环境应力相当严酷,同时又要求高可靠长寿命,若采用传统的可靠性增长试验技术,时间长、费用高,难以承受。近年来,可靠性强化试验技术发展迅速,因其具有低成本且高效的优点,应用越来越广泛。本文将可靠性强化试验技术应用于该型复合型传感器,开展了如下研究工作:首
情感分析或意见挖掘是对人们对实体及其附属或特定定义具有感情色彩的主观性观点的计算研究。该领域的起步和快速发展与社交媒体的保持发展相一致,如国内微信、微博、QQ空间、抖音等社交媒体,随着社交媒体的迅猛发展和海量数据的生成,越来越多的研究将社交媒体信息用于医学领域研究,其中精神医学是其热点领域之一。本论文主要面向领域文本情感分析做了两方面工作,具体如下:一、Google发布了一种基于深度双向Trans
行人重识别(Person Re-Identification)指跨摄像机行人检索,其目标是通过检索得到同一个行人在不同摄像机下的图像。特征提取是行人重识别的第一个步骤,但是由于行人的运动、目标检测算法的使用以及不同摄像机所处的环境差异等,行人的图像中存在多种不对齐问题。这些不对齐问题会使得图像中行人的外观特征产生偏差,进而影响行人重识别的精度。在本文中,我们研究了行人图像的特点,并将不对齐问题划分
移动机器人在开放环境中执行复杂任务时,通过基于对环境变化的规约来构建控制模型以驱动机器人运行。这为移动机器人这一软硬件协同工作的平台带来以下挑战:(1)开放环境的不确定性使得模型设计的先验知识缺失,从而导致机器人行为决策存在未知风险;(2)受限于物理环境与物理行为,移动机器人行为决策的执行效果与预期不完全匹配;(3)感知信息的滞后性的存在要求移动机器人在短时间内生成行为决策以避免感知信息失效。针对