【摘 要】
:
随着无人潜航器技术的发展,无人潜航器将是未来高技术海战场条件下不可忽视的对抗力量,但对抗成败的关键也不仅在于装备本身,更在于如何综合筹划、有效运用和精准布控兵力,做
论文部分内容阅读
随着无人潜航器技术的发展,无人潜航器将是未来高技术海战场条件下不可忽视的对抗力量,但对抗成败的关键也不仅在于装备本身,更在于如何综合筹划、有效运用和精准布控兵力,做出一系列正确的指挥决策,这也对其智能化以及自主能力有了更高的要求,攻击过程中的智能决策尤为重要。深度强化学习由于其较好的模型适应能力以及可学习能力,通过在对抗环境中学习并找到问题的最优解,因而可以应用于无人潜航器的鱼雷攻击决策过程。本文针对无人潜航器鱼雷攻击问题的考虑稀疏奖励问题和序贯决策问题的改进强化学习决策研究,针对研究问题的基本属性,进行了数学建模和仿真程序设计,在机动目标打靶和红蓝对抗任务中对算法进行了仿真验证。主要包含一下几个方面:(1)本文首先对对抗问题进行分析,明确了对抗环境中无人潜航器的基本属性,对无人潜航器鱼雷攻击过程进行了数学建模,设计了包含声呐探测、机动、鱼雷导引的仿真环境;然后对场景要素进行详细设计,将数学模型具体实现为仿真系统程序。最后,根据对抗环境模型确定了决策系统的输入与输出,明确了决策系统与对抗仿真环境的交互过程。(2)针对无人潜航器鱼雷攻击决策中存在的不利于强化学习求解的稀疏奖励问题,通过对不成功历史经验的再利用方法增加了额外的奖励反馈加以解决,并且在无人潜航器机动目标鱼雷打靶任务中,验证了算法的有效性,并对比分析了改进算法和常规算法的效能,结果证明改进算法具有更高的决策能力。(3)考虑到使用深度强化学习算法进行决策时无法综合运用长时间的历史信息问题,将深度强化学习方法与长短期记忆网络相结合,在无人潜航器机动目标打靶场景以及红蓝双方对抗场景中,对改进算法进行了验证,结果表明,历史状态信息对于深度强化学习的决策能力而言具有积极影响。
其他文献
随着人工智能技术、计算机仿真技术、传感技术等技术的不断发展和成熟,虚拟现实技术在很多领域都有进一步的应用,涉及到航空航天、教学、游戏开发、医疗、制造业等领域,尤其
乙烯的产量是衡量一个国家工业发展水平的标志。目前,乙烯的生产主要依赖于不可再生的石油资源,且从石油获得的乙烯产量不能满足当前市场的需求。而甲醇可再生、来源广和价格低,以甲醇制烯烃(MTO)能解决烯烃短缺的问题。具有适宜的中强酸性和独特孔道结构的SAPO-34,在MTO反应中展现出良好的低碳烯烃选择性,成为MTO反应催化剂的最佳选择。但SAPO-34在MTO反应中的单程催化寿命较短,催化剂需要不断循
重组的中化建矿业公司已经完成采供、销售矿石340kt,年底有望拥有或管理的资源近300Mr。8个月完成采供、销售矿石340kt,上缴各项税费1400多万元,磷矿资源后备基地、化肥生产装置
正确认识水政监察队伍的“窗口”作用,建立和完善水政监察队伍制约机制,明确水政监察队伍组织、思想建设的重要意义,对做好县级水政监察队伍建设是十分必要的。
20世纪80年代以来,消费主义思潮在我国蔓延,并逐渐对国内青年的消费价值观和消费行为带来越来越多的影响,因此当前研究青年的消费现状。分析青年消费误区产生的原因及如何有效开
招投标环节是严格控制公路工程行业秩序的关键一步,同样是提升我国公路交通基础设施构建层次的必要举措。基于此,着力于公路工程建设招投标管理这一课题,本文先简述了招投标
国有土地有偿使用制度的建立,促进了经济和社会的发展。在当前的新农村建设中,如果能进一步规范管理农村集体土地使用权的流转,提高土地利用效率,在土地使用机制上进行合理的改革
在国家调控日益加码和房地产行业深入发展的背景下,加大商业地产投资戍为房地产行业的一股热潮,众多主流房企正试图实施商业地产战略转型。但是,商业地产的固有特点决定了该转型
本文在前人研究的基础上,通过对30届伦敦奥运会现役优秀乒乓球运动员大赛录像分析,对其他们在比赛中发球技术的运用进行归纳总结。从以下几个方面进行总结,抛球高度的自主性,多元
Web 2.0时代的发展带动了消费者在线信息分享行为,信息形式日趋多样化,信息载体也从网上购物平台,扩展到各类专业领域论坛。面对规模庞大且增长迅速的在线评论,如何通过有效