基于强化学习的无人机空战机动决策

来源 :航空电子技术 | 被引量 : 0次 | 上传用户:KOUHUIKING
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对一对一空战中无人机机动决策问题,提出了一种基于强化学习的无人机空战机动决策方法。在强化学习的框架下,分析表征空战态势的各主要因素,建立空战优势函数并以此作为强化学习回报值的基础;设计空战机动决策的动态模糊Q学习模型,对空战机动决策的状态空间进行模糊化作为强化学习的状态输入;选取典型空战动作作为强化学习基本行动,通过各模糊规则的触发强度加权求和实现连续行动空间的覆盖。相对于传统方法,本方法具有更强的鲁棒性和自主寻优性,在不断的仿真和学习中无人机所做的决策水平能够不断提高。
其他文献
从对数周期偶极子天线(LPDA)特性和结构出发,通过数学建模,定量计算出对数周期偶极子天线的空间场型分布。针对不同天线阵子数下的水平和垂直剖面的方向图,根据辐射分布特征,给出优
望子成龙、盼女成凤是天下做父母的共同心愿,如何开启儿童的心智、激发和培养孩子的求知欲望和探索兴趣、科学地引导孩子呢?最好的方法就是在家庭中使用一些因地制宜、简便易行
面部皮肤保健青春痘的成因目前尚不十分清楚,一般认为.青春痘主要是南于青春期体内的雄激素分泌增多引起的。雄激素在青少年的发育过程中起着重要的作用。在青春期,青少年体内的
针对分布式集成的DIMA网络系统提出一种基于时钟偏斜的时间触发通信调度方法。该方法在考虑时钟同步误差和时钟漂移造成的时钟偏斜情况下,对时间触发消息流传输路径相邻上下级
分析了航空电子系统领域面临的新技术有效导入、研发周期及成本高、跨平台互操作性差等问题,深入研究了国外项目实践和标准规范,将开放式系统架构应用于航空电子系统,提出开
综合模块化航空电子系统通过可配置的共享硬件资源技术大幅提升了系统任务可靠度。但此类多资源余度系统的硬件资源存在位置识别冲突,会导致余度系统整体性共因失效风险。提