基于RBF神经网络的Q学习飞行器隐蔽接敌策略

来源 :系统工程与电子技术 | 被引量 : 0次 | 上传用户：BecauseArc

【摘要】

：

基于马尔科夫决策过程框架研究了三维空间内隐蔽接敌策略的强化学习方法,定义了环境模型中的优势区域和暴露区域。针对高维状态空间策略学习所面临的维数灾问题,给出基于径向

【作者】

：

徐安寇英信于雷李战武

【机构】

：

空军工程大学工程学院

【出处】

：

系统工程与电子技术

【发表日期】

：

2012年1期

【关键词】

：

强化学习隐蔽接敌马尔科夫决策过程动态规划空战决策

【基金项目】

：

航空科学基金(20095196012)资助课题

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

基于马尔科夫决策过程框架研究了三维空间内隐蔽接敌策略的强化学习方法,定义了环境模型中的优势区域和暴露区域。针对高维状态空间策略学习所面临的维数灾问题,给出基于径向基神经网络（radial basisfunction neural network,RBFNN）的Q学习算法,说明了训练样本的分级采样方法,并针对不同情况下的接敌机动策略学习进行了仿真分析。仿真结果表明,借助于合理的分级采样方法,基于RBFNN的Q学习算法能有效生成隐蔽接敌策略。

其他文献

飞行校验系统GPS/DGPS定位及排故分析

飞行校验对保证各类导航设备的精度符合性至关重要,完成飞行校验的核心部件是机载飞行校验系统,其中的飞机实时定位分系统对校验结果产生重要影响。本文对当前校验系统中较常

期刊

飞行校验定位全球定位系统差分全球定位系统排故

湖北省成立医疗保险研究会研究会举办医疗保险医疗服务行为监管研讨会

9月25日，湖北省医疗保险研究会在武汉正式成立。中国医保研究会、省民政厅、省人社厅领导，部分高校学者、医疗专家，各市州医保管理工作者参加了成立大会及第一届会员代表大会。

期刊

医疗保险湖北省医疗服务行为管理工作者监管医疗专家会员代表行政决策

甘肃红芪中5种微量元素含量及健康风险分析

目的了解红芪中Al,Mn,Cu,Zn和Mo等人体必须微量元素的含量,并客观评价这5种微量元素对长期服用红芪人群的健康风险。方法在红芪道地产区甘肃省采样,采用ICP-MS法测定了红芪中

期刊

红芪微量元素健康风险评价

每年19万人因用药不当死亡

据第三次国家卫生服务调查显示，两周患病后采用自我医疗的居民占35．7％，其中农村占31．4％，城市占47．2％，“大病到医院、小病去药店”已经成为药品消费的主流意识。非处方药物协会副会长张

期刊

用药不当非处方药物协会国家卫生服务调查死亡安全隐患自我医疗药品消费分类管理

现代性论域中的社会文明与社会精神

社会文明与社会精神的培育,是现代社会转变及其现代性建构及重建的重要任务,从国家、个人向社会的跃迁及其社会性的生成,决定着社会文明与社会精神之历史生成的艰难迟缓,诸多

期刊

社会文明社会精神现代性马克思现代社会转变

荷那龙罗非鱼体内不同组织脂肪酸组成的差异分析

实验以荷那龙罗非鱼（Oreochromis hornorum）为研究对象,在自然正常的养殖条件下,随机的抽取15尾荷那龙罗非鱼,取背侧肌、肝胰脏、肠和内脏脂肪组织四个组织的样,来分析不同组织

期刊

荷那龙罗非鱼气相色谱差异分析

基于RBF神经网络的Q学习飞行器隐蔽接敌策略

其他学术论文