基于Q学习的高超声速飞行器路径规划方法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:xxcdejingcai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,高超声速飞行器在空天技术领域取得了突破性的发展,以其独特的优势成为世界关注的焦点。高超声速飞行器具有高空高速以及高机动能力的特点,面向未来空天作战和商业应用,基于高超声速飞行的智能化具有极其重要的意义。路径规划是高超声速飞行器执行飞行任务的重要技术,特别是需要面对来自地面或空间的未知威胁。飞行器路径规划的目的是在机动性能、敌人威胁和飞行时间等多约束条件下,寻找最优或次优路径以有效规避威胁。随着空中任务难度的不断增加,特别是在未知环境下,路径规划需要考虑更多不确定性因素的影响,迫切要求飞行器具有学习能力,以适应环境变化的不确定性。随着人工智能领域的发展,机器学习中的强化学习技术使得路径规划不仅可以对环境模型的依赖性变弱,而且也不再需要环境提供先验知识,而是通过不断的试探与学习实现。因此,利用强化学习进行路径规划来提高飞行器对未知环境的适应性具有重要的研究和应用价值。针对该研究方向,本文开展了以下几个部分的研究:(1)Q-Learning下的基本路径规划方法研究。研究Q-Learning算法用于路径规划问题的可行性,由于该算法自身对于环境有一定的适应性和学习能力,同时该算法对于环境地图的建模是非必须的,这些特性使得利用该算法进行路径规划的物体能够自身处理移动过程中的未知情况。本文通过仿真实验,证明Q-Learning算法可以有效的解决路径规划问题。(2)快速搜索的Q-Learning路径规划算法研究。由于经典Q-Learning算法在应对路径规划问题时存在许多问题,包括学习与利用的平衡问题,算法收敛速度等问题,针对这些问题研究快速搜索的Q-Learning路径规划算法。在经典算法的基础上,对Q-Learning进行改进,引入快速探索策略及动作搜索策略,进而提高经典算法的快速收敛性。(3)高超声速飞行器路径规划算法研究。研究飞行器的自身机动约束及飞行动态约束,对相关约束进行建模,并建立高超声速飞行器威胁区规避的路径规划仿真场景。针对该场景,研究Q-Learning算法在动力学约束条件下的路径规划方法,为飞行器生成可成功避障且到达目标点的可飞路径,并通过仿真实验对比验证算法效果。实验表明,基于Q-Learning的算法能够在飞行器约束下得到避开威胁的路径,且快速搜索机制能够进一步优化算法性能。本论文利用强化学习理论方法对高超声速飞行器路径规划问题开展方法研究和仿真实验验证,证明了Q-Learnnig算法可以有效的解决路径规划问题,并且在满足高超声速飞行器的飞行约束的条件下,该算法也可以得到一条能够合理避开威胁的理想路径,为高超声速飞行器自主控制技术的发展提供了理论依据。
其他文献
教育治理是深化我国教育领域综合改革的重要举措,现已成为教育领域研究者的研究热点。文章以2005-2020年中国知网收录、CSSCI来源期刊刊载的369篇教育治理研究论文为分析对象,运用关键词词频与聚类分析等方法剖析教育治理研究的“知识地图”。整体而言,我国教育治理研究成绩斐然,但教育治理理论与实践研究尚不能满足我国教育现代化建设的需求。未来,教育治理在研究逻辑上,要立足于中国特色国家治理体系和治理
量子力学是现代物理学的两大基本支柱之一,是描述微观世界系统的理论。Schr(?)dinger方程是量子力学的核心方程,是将波动方程与物质波的概念相互结合所建立的非相对论的二阶偏微分方程。Schr(?)dinger方程显示了微观系统中粒子的状态随着时间变化的规律,每个微观系统都有一个相对应的Schr(?)dinger方程(组),绝大部分微观系统导出的Schr(?)dinger方程组都是耦合的,因此在
声音场景重建是一种根据音频信号中声音事件特征重建场景图像的新型信息处理方法,在场景感知、安全侦察、多媒体分析、电影场景制作等方面具有广泛的应用价值。目前用于声音场景重建的生成对抗网络理论依然处于初期发展阶段,模型训练过程稳定性欠佳,并且重建图像的分辨率与质量也难以满足要求。为此,本文重点围绕基于生成对抗网络的声音场景重建理论与实现方法,针对注意力机制、谱归一化、UNet网络、残差网络及金字塔网络等
作为变分不等式的一个推广,半变分不等式及其系统在力学、物理学、工程科学、经济学、最优控制等领域都起着重要作用。因此,以KKM定理、有限元方法或者满射性引理等为工具,各种类型的半变分不等式及其系统被广泛研究,并获得了丰富的研究成果。在本文中,我们考虑了一类广义的系统变分--半变分不等式模型,该模型可应用于研究一类热粘弹性体的摩擦接触问题。首先,在Bochner-Lebesgue空间中,本文研究了带有
盲源分离问题是盲信号处理领域中经典且非常重要的问题之一,在军事、通信、医学等众多领域有重要的应用价值。盲源分离的含义是在不知道源信号及信号混合参数的情况下,仅通过观测到的混合信号获得源信号的估计。通过观测信号的协方差矩阵或者累积量矩阵具有可近似对角化的结构,获得源信号的估计的方法称为矩阵联合对角化算法,是解决盲源分离的一类非常有效的代数算法,已广泛的应用于盲信号分离问题之中。根据联合对角化是否具有
得益于其卓越的机械性能,复合材料在各个领域内得到了广泛的应用。然而在复合材料的生产、运输和使用过程中难免会受到随机因素的影响,导致材料的失效,严重时甚至引发重大安全事故。因此,对复合材料构件的健康状态进行合理有效的检测和评估意义重大。红外热波无损检测技术,作为一种非接触式检测技术,具有适用范围广,方便直观等诸多特点,在近三十年内得到了快速的发展,并广泛应用于航空航天、军工、新材料、核电系统等各个领
旋翼无人机具有其体积小、灵活性高等优点,可在空中进行视觉方面的图像处理任务,相比固定监控设备在交通状况的检测中具有部署成本低的优势。但现阶段应用于旋翼机平台的检测与跟踪算法尚有不足之处,一是当前的检测与跟踪相关算法主要基于深度学习,网络结构复杂,而适用于旋翼机平台的机载设备性能有限,无法满足计算资源等相关需求;二是旋翼机航拍视角下的小目标居多,导致对图像特征信息提取难度较大,相应地会出现漏检或错检
随着人工智能技术的迅猛发展,使用图像或声音信息表征目标的方法日益增多。由于目标所处物理环境的信息多样性和复杂性,单独使用视觉或听觉信息难以完整表征感知目标。为此,本文围绕视听觉信息特征提取与融合方法展开研究,实现低信噪比环境条件下对目标视听觉信息的综合处理、融合与感知。主要研究工作如下:首先,本文建立了包含900秒声音和1150张图片的数据集,并根据实际环境中的噪声干扰、增益异常等情况,通过设定信
无线光通信具有速率高、抗干扰、体积小、重量轻、功耗低的优势,是未来通信技术发展的重要方向之一,在载荷受限的小卫星、无人机上具有巨大的应用价值。目前,绝大部分无线光通信研究基于高斯光束。而平顶光束中心光强分布更均匀、大气湍流展宽更小,具有提升无线光通信性能的潜力,正受到越来越多的关注。然而,现有平顶光束无线光通信性能研究普遍基于光轴静止的经典光传输理论,研究结论仅适用于固定应用场景。在移动应用场景下
在实际问题中,存在大量的模糊性现象,而经典集合论“非此即彼”的绝对性在描述这些模糊性现象时受到限制,由此产生了模糊数学。模糊积分方程作为模糊数学的重要分支,目前广泛应用于模糊控制和模糊经济等领域。现有大量学者对于一维模糊积分方程进行了研究,得到许多有效的数值方法,而对于二维模糊积分方程的研究相对较少。因此,本文提出了求解二维模糊Volterra积分方程的约化模糊微分变换法,该方法类比了模糊微分变换