基于深度强化学习的固定翼无人机编队协调控制方法

来源 :航空学报 | 被引量 : 0次 | 上传用户：xgzyf2009

【摘要】

：

由于运动学的复杂性和环境的动态性,控制一组无人机遂行任务目前仍面临较大挑战.首先,以固定翼无人机为研究对象,考虑复杂动态环境的随机性和不确定性,提出了基于无模型深度

【作者】

：

相晓嘉闫超王菖尹栋

【机构】

：

国防科技大学智能科学学院,长沙 410073

【出处】

：

航空学报

【发表日期】

：

2021年4期

【关键词】

：

固定翼无人机无人机编队协调控制深度强化学习神经网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

由于运动学的复杂性和环境的动态性,控制一组无人机遂行任务目前仍面临较大挑战.首先,以固定翼无人机为研究对象,考虑复杂动态环境的随机性和不确定性,提出了基于无模型深度强化学习的无人机编队协调控制方法.然后,为平衡探索和利用,将ε-greedy策略与模仿策略相结合,提出了ε-imitation动作选择策略;结合双重Q学习和竞争架构对DQN(Deep Q-Network)算法进行改进,提出了ID3QN(Imitative Dueling Double Deep Q-Network)算法以提高算法的学习效率.最后,构建高保真半实物仿真系统进行硬件在环仿真飞行实验,验证了所提算法的适应性和实用性.

其他文献

Electrochemical trepanning with an auxiliary electrode

Electrochemical trepanning (ET) is one of the main methods for processing the blisks in aero-engines.However,stray corrosion in ET has a very negative impact on

期刊

Aero-engineAuxiliary electrodeCurrent densityElectrochemical trepanningStray

g-C3N4/RGO的制备、光催化降解性能及其降解机理

尿素固相反应得到石墨相氮化碳(g-C3N4),石墨(G)被氧化制得氧化石墨(GO),GO被还原制得石墨烯(RGO),通过3种复合方法分别制得g-C3N4/RGO材料.通过对污染物亚甲基蓝、罗丹明B和

期刊

g-C3N4/RGO复合材料光催化降解复合比选择性

基于离散伴随的流场反演在湍流模拟中的应用

精确模拟湍流流动是学术界和工业界均普遍关注的问题.采用数据驱动湍流建模的思路,建立了基于离散伴随方法的流场反演框架.通过为SA模型涡黏性输运方程的生成项乘以非均匀分

期刊

湍流模拟数据驱动流场反演离散伴随约束优化

多飞行器的分布式优化研究现状与展望

航空领域的多个飞行器协同搜救、区域监控、编队飞行等实际任务具有个体数量多、信息分散、任务指标复杂等特点,分布式优化是实现上述任务中多飞行器有效协同的重要保证,具有

期刊

多飞行器分布式优化控制决策协同合作通信与计算平衡

与作者共同创作——中学语文阅读教学创新能力的培养

爱因斯坦在中说:“由没有个人独创性和个人志愿的统一规格的人所组成的社会,将是一个没有发展可能的不幸的社会.”“学校的目标应是培养独立工作和独立思考的人.”也明确指出

期刊

中学语文阅读教学共同创新创新能力

Experimental, analytical and numerical investigation on tensile behavior of twisted fiber yarns

Stitched composite materials are emerging as a promising material due to their high interlaminar strength,combined performance and light weight.The mechanical p

期刊

FrictionStitched compositeTensile behaviorTwistYarn architecture

Reflection of a moving shock wave over an oblique shock wave

The reflection of a moving shock wave over a wedge immersed in a still gas and the reflection of a wedge induced steady shock wave over symmetrical and asymmetr

期刊

Shock reflectionTriple pointUnsteady shock wave

基于数据挖掘的飞行器气动布局设计知识提取

为了更深入地理解飞行器气动布局设计优化中多目标/多设计变量间的影响关系,提高优化模型的科学性及优化效率,对基于数据挖掘技术的飞行器气动布局隐含设计知识提取问题开展

期刊

气动布局优化设计数据挖掘知识提取等度量映射自组织映射决策树总变差分析

Two new multi-phase reliability growth models from the perspective of time between failures and thei

Aviation products would go through a multi-phase improvement in reliability performance during the research and development process.In the literature,most of th

期刊

Reliability growthTest-find-test strategyTest-fix-test strategyTime-varying f

小学语文课堂教学中有效提问的研究

《义务教育语文课程标准》的新课标中要求加强教师和学生之间的互动、对话和交流,认为这样的方式比单方面的课堂灌输更能够起到启发思维和激发学生学习积极性的作用。诚然,如

期刊

小学语文有效提问方法

基于深度强化学习的固定翼无人机编队协调控制方法

与本文相关的学术论文