面向无人集群的多目标动态分配技术研究与实现

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:w02114119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着无人机应用越来越广泛,人们已经不满足于单无人机的使用,于是研究者们受启发于自然界的集群行为,提出了无人集群的概念。而本文关注的是无人集群研究中的一个典型问题——无人集群多目标分配问题。该问题要求每架无人机必须准确到达每个目标位置,并在飞行过程避免相互碰撞和躲避威胁区域。在传统的解决方法中,它被视为一个最优化问题进行求解。但是这类方法求解需要全局信息,一旦环境发生改变,就需要重新计算最优解,这样就无法保证无人集群系统能够实时应对动态环境。同时,没有有效的手段验证算法在实际物理环境下的正确性。除此之外,在实际应用场景中,由于GPS误差很大,无人机很难精准的飞抵每个目标正上空,一般要利用差分GPS等额外的硬件支持才能实现准确悬停,但这样会增加成本和系统的复杂度。针对传统方法的局限性,本文的主要贡献有:(1)提出面向无人集群的多目标动态分配系统架构。该系统架构集成算法训练、跨开发环境模型部署以及对算法的三维物理仿真实验模块。在该系统中,三个模块互相协作完成无人集群多目标动态分配模型的训练、部署和仿真实验,是一个面向该问题的完整系统架构方案。(2)提出面向无人集群的多目标动态分配算法。该算法基于多智能体强化学习思想,将传统的无人集群多目标分配问题转化为多智能体训练问题,这样该问题的求解就从最优化过程转化成了马尔科夫决策过程。由于后者是离散的,状态之间的转移只与当前的状态和经观察环境选择的动作有关,并且训练中环境也是随机变化的,因此训练出的决策模型可以很好的适应动态环境而无需重新训练。在此基础上,我们还提出了“临界区域”设置,用以加强避撞的训练效果。(3)提出无人机准确悬停算法。该算法基于Q-learning强化学习思想,利用计算机视觉信息进行建模,将无人机与目标的相对位置映射到状态空间,于是准确悬停过程也转化为了离散的马尔科夫决策过程。由于状态空间可以划分的很小,无人机的位移也依赖状态的转移,因此可以很精确的控制无人机到目标的正上方悬停。最后,本文还基于ROS+Gazebo构建了三维物理仿真环境,实现了原型系统,验证了算法的正确性和有效性。在原型系统中,我们为了解决无人机仿真运行环境与模型运行环境不兼容的问题,采用了远程过程调用机制,在两种环境之间搭建模型部署模块。经原型系统验证,我们的算法是有效的。
其他文献
在反无人机集群(UAV Cluster/Swarm)任务中,需要通过态势(Situation)分析掌握无人机的威胁程度、运动趋势等情况,以制定最优的反制策略。人工为主的态势分析存在注意力、处理速度等方面的生理极限,在面对无人机集群包含的大量个体时,可能难以准确、实时地提供态势分析结果。相比而言,机器为主的态势分析中,大量分析任务由计算机完成,人的角色由数据分析转为结果评判、系统维护等,这种新型人机
本文以高超声速飞行器热防护系统对超高温(2000℃~2500℃)、抗氧化、零烧蚀材料的迫切需求为背景,开展了C/C复合材料表面IrHfx/Ir抗氧化涂层体系的设计、制备与抗烧蚀性能研究。设计了Re/SiC作为改性Ir涂层的粘接层和热膨胀过渡层,研究了二者间的热物理化学兼容性,揭示了SiC层改善C/C基体与Re层热物理兼容性的作用机制。基于实验和热力学计算研究,分析了Ir层表面的渗Hf过程,开发了基
连续相位调制(Continuous Phase Modulation,CPM)是在航空遥测领域应用广泛的调制体制,其中,成形偏移正交相移键控(Shaped Offset Quadrature Phase Shift Keying,SOQPSK)信号的预编码特性使其相位状态可以根据前两位比特唯一确定,对该信号运用Viterbi算法译码时状态网格图较为直观。多指数连续相位调制信号(Multi-h CP
多目标数据关联与跟踪技术是光学监视卫星对目标进行状态估计和态势评估的关键技术之一。相较于同步轨道卫星,中低轨卫星距离观测目标更近,但是,中低轨卫星自身平台会产生较大幅度的运动,给目标的跟踪造成了一定的难度。本文即针对中低轨动平台下的多目标数据关联与跟踪技术进行研究,主要研究虚假轨迹剔除、片段轨迹关联以及机动目标跟踪三个方面。论文的内容主要包括以下三大部分:第三章研究了恒星类虚假轨迹剔除技术。首先介
美国等国家在持续发展强大的空间目标监视系统,我国的航天器,大至空间站,小至皮纳卫星,全部暴露在其监视之下,任其跟踪、被其编目、由其预报,不仅航天器自身安全受到威胁,从任务层面更是难以保守秘密,对国家经济利益、政治利益尤其军事利益产生不良影响。这一问题已经在航天界引起关注,并催生了卫星隐身技术的研究,但由于关键技术与经济代价等原因进展缓慢,远未达到实用化水平。本文独辟蹊径,从轨道设计角度寻求该问题的
信息化技术不断发展成熟,用频设备的数量越来越多,辐射源的功率越做越大,强电磁武器技术发展也极为迅速,电子信息系统面临着前所未有的强电磁威胁。高速大功率限幅技术是目前射频前端防护最有效的手段之一。本文主要围绕应用于传输线和天线的高速大功率限幅技术展开了研究。首先,研制了一款宽带高速大功率集成限幅器。通过对比分析各种限幅电路的优势和局限性,充分利用Si基PIN二极管耐受功率高,Ga N肖特基二极管响应
冲压旋转爆震发动机作为一种使用爆震燃烧作为组织燃烧方式的新型推进系统,具有更高的理论热循环效率以及更紧凑的结构,在未来的发展中具有很广阔的前景。但旋转爆震发动机隔离段独特的环形结构,以及燃烧室内的恶劣反压环境都对冲压旋转爆震发动机的隔离段提出了更高的要求。本文通过数值模拟手段,对不同隔离段构型以及出口旋转反压条件下隔离段来流和燃料喷注混合进行研究,并且进行了不同来流马赫数下的旋转爆震燃烧模拟研究。
为了提高放射培训考试工作的效率,节约成本,突破放射培训考试工作在人力、物力和时间、空间各方面的条件限制,依托数字化与“互联网+”,通过web页面搭建基于微信小程序的放射培训考试系统。本研究完成了基于微信小程序的放射培训考试系统的开发,使各部分通过网络互相联通,保证数据互通和业务联动。该系统可以使学员全天候、全时段在线参加培训和考试,节约了人力、财力,提高了工作效率,实现了系统建设的预期。
新型高速飞行器对可快速制备的高性能隔热材料提出了迫切需求。本文采用气相氧化铝粉末为纳米基体,莫来石纤维作增强纤维,铝酸盐水泥作粘接剂,α-SiC粉作遮光剂,Pluronic P84作表面活性剂,去离子水作溶剂,以浇筑成型、常压干燥制备工艺,制备出了耐高温气相氧化铝基隔热复合材料。系统研究了材料的制备工艺、结构与性能的关系规律,并对材料的性能进行了测试和表征。结论如下:通过材料体系和制备工艺设计,确
卫星研制与运行过程中存在大量不确定性,对卫星性能和寿命直接造成影响。需要在设计阶段就综合考虑各类不确定性影响,开展面向可靠性和综合效益的设计优化。其中,如何对各类不确定性因素进行准确建模,是有待解决的首要问题。针对卫星多层级系统集成的特点,本文基于贝叶斯融合方法提出了复杂多层系统结构的多源信息融合方法,为卫星的不确定性建模提供新思路,主要研究内容如下:首先,对卫星不确定性建模及多源信息融合方法的研