基于深度强化学习的无人机自主飞行控制算法的研究与实现

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:wangtantan121212
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着无人机技术的发展,无人机在众多领域得到了广泛的应用,同时也对无人机的功能与性能要求日益严苛,有诸多关键技术和共性技术需要解决,其中自主飞行控制就是最基础最重要的技术。根据无人机自主飞行控制任务的特性,本文选用深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)为基础算法进行研究,针对无人机长距离目标任务引起的状态空间剧增现象,解决无人机自主控制任务中的奖励稀疏问题,帮助智能体更快速有效地学习到控制无人机完成自主飞行任务的策略,本文提出了基于子任务生成和经验特征存入(Sub-Goal Generation and Empirical Feature Storage,SGG-EFS)的强化学习算法,主要工作和贡献在于:(1)提出基于经验特征存入的强化学习算法,通过特征提取方法提取经验的特征值来控制经验的存入,便于经验池对有效经验的管理,保证存储尽可能多的不同的经验来供智能体学习。这种方法避免了由于大量重复的经验占用经验池空间,而导致网络不能充分学习获取到的经验的问题。采用哈希的方式对特征值进行管理,可以保证查询速度。(2)提出子目标生成算法,对长距离目标任务进行拆分,不同的任务场景通过拆分后,可以一定程度上缓解状态空间的增长,甚至产生相似的子目标场景。智能体之前学习到的经验可以直接用于新的相似场景中,可以提高算法模型的泛化能力。(3)在仿真环境中进行对比实验,与原始的DDPG算法和优先级经验重放算法相比,本文基于子目标生成和经验特征存入(SGG-EFS)的强化学习算法在学习速度和策略稳定性上都具有较好的表现。为了验证算法的有效性,将SGG-EFS算法应用于X-Plane模拟器复飞场景的舰载机自主控制任务中,针对舰载机自主控制任务设计了马尔科夫决策过程模型。使用SGG-EFS算法完成不同场景的舰载机自主控制任务,证明了该算法在实际问题上有很好的应用效果。
其他文献
随着我国经济的不断发展和“十三五规划”的完成,我国的高速公路网和铁路网已经基本建成,未来政府基础设施投资的重心会转向城镇市政工程建设,这一点在“十四五规划”的第二十八章——《推进以县城为重要载体的城镇化建设》中也得到了印证。市政道路建设是城镇化建设的重要基础,市政道路建成通车不仅可以改善当地交通条件,还可以带动当地经济发展和改善民生。因而,市政道路项目对于施工进度的要求更为严格,一旦项目施工进度控
学位
近年来,物理学科开始重视从学科素养角度出发培养学生的物理学科核心素养,其中“科学态度与责任”素养是对物理教学价值与社会价值的深刻体现,是对学习物理更高层次的价值追求。为此,了解少数民族地区高中生的物理科学态度与责任素养现状,分析少数民族地区高中生学习物理的态度各有差异的原因,并提出相应的培养对策,以期提升学生的物理科学态度与责任素养,为少数民族地区的一线教师提供参考依据。本研究首先采用科罗拉多学习
学位
目标跟踪作为计算机视觉的一个基本任务,最近几年受到广泛的关注。而近几年基于Anchor-Free思想的目标跟踪器由于其无需设置大量超参数便可实现与AnchorBased思想目标跟踪器相同甚至更优异的性能而受到广泛关注。然而目前基于AnchorFree思想的目标跟踪器依然存在很多问题。针对基于Anchor-Free思想的目标跟踪器所存在的一系列问题,本文采用了一种全新的结构来解决上述问题。本文主要的
学位
社会中的每一个人,都需要在社会中不断学习和成长。垃圾分类不仅是一个城市环境卫生问题,垃圾分类的要求深深影响着居民的意识和行为,相关政策也是对居民的一种教育,居民是怎样学习和接受这一政策并有良好的行为,有待于进行挖掘以供相关政策更好地开展,有助于促进运用政策达到社会治理效果,引导社会成员进一步向学习型社会迈进,因此本研究具有重要的意义。本文从学习者角度出发,梳理学习型社会的内涵、政策宣传的含义和相关
学位
在国际贸易快速发展,港口集疏运需求不断增大的背景下,促进集装箱海铁联运发展成为国家层面推进交通强国建设及综合立体交通网络构建的重点任务。海铁联运的有效开展不仅依赖于完善的集疏运网络以及无缝衔接的换装设施设备,更需要科学合理的集疏港作业组织计划。基于此,本文以集装箱疏运班列为研究对象,以集装箱海铁联运疏运班列组织方案为研究内容,针对铁路运输与港航运输资源之间的协调问题,开展考虑船舶到港时间约束的集装
学位
“乡村振兴”背景下的重振乡村教育与贯彻十八大以来,实现“公平有质量的教育”背景下的教育教学改革目标是一致的。中小学在通过国家课程全面落实基础、均衡、优质的学生培养基础上,尚需通过校本课程的完善与发展,推动学校开展特色、个性化、多元化教育教学,为乡村振兴、地方经济转型、乡村文化发展培养更多的多样化人才。因此,本研究以“乡村小学校本课程开发的现实困境与突围路径”为主题,以案例研究为主要方法,呈现乡村小
学位
新冠肺炎疫情爆发后,随着企业复工复产的有序进行,需要对出入公共区域的人员进行测温筛查,防止疫情的扩散。传统的手持式测温设备需要近距离接触才能测量,对防疫测温人员来说存在一定的危险性,并且存在耗时长、数据不准确、效率低等问题。为了解决目前测温方式效率慢的问题,本文采用人脸识别技术和红外测温技术相结合的方式达到了快速、大范围测温的目的。我们知道自然界中一切高于绝对零度的物体都在对外发生红外辐射,其辐射
学位
应时代之需和国家战略发展安排,科学教育的发展与水平提升已经成为教育领域内的重中之重。而学前儿童科学教育是科学教育的祭奠阶段,寻求幼儿科学教育的优化方案更是亟待解决的关键问题。分析当下幼儿科学教育的主要困境,一方面在于对幼儿科学素养的了解缺失。基于此,另一方面,教师对于幼儿的“不解”与“误读”也使得教师难以给予幼儿及时有效的支持。“幼儿朴素概念”是解决这一困境的有效抓手。通过长期观察发现,幼儿在角色
学位
由于传统能源的不可再生性,开发和利用可再生的清洁能源,对减少化石燃料的使用有着重要意义。氢气具有零碳含量的特点,能量密度较高,足以与石油媲美,被认为是一种无污染,可以满足未来可持续发展需求的替代燃料。通过水分解产生氢气有着重要的应用价值,这是因为水解制氢可以通过分子间的转化实现大量能量的储存,且不会产生温室气体和其他污染物。层状双氢氧化物(LDHs)被认为是一种很有潜力的水电解催化剂。经过调研,本
学位
<正> 病例报告黄××男,49岁,已婚,江苏籍,泥工,1980年6月25日第5次入院。患者于1968年6月,因孩子手指患有肿瘤截除,妻多病,要求经济补助未遂,开始失眠,兴奋话多,又唱又跳,自言自语,于7月13日首次住院。诊断:“心因性反应”。经用氯丙嗪,
期刊