论文部分内容阅读
近年来,无人机系统在军用领域和民用领域的应用潜力备受青睐。随之而来,系统的安全性和自主性亦成为无人机执行复杂任务的必要条件。然而空地通信能力的受限和弱人机交互的情况给无人机的自主性能和安全性能带来极大挑战。特别是应对突发障碍情况时,无人机需要依赖于自身携带的传感器与控制器,实现自主感知探测并完成自主规避控制。论文以轻小型无人机为背景,以视觉传感器为基本感知手段,研究自身载荷能力和计算能力受限条件下的无人机感知与规避控制技术及其自主学习方法,主要工作及贡献如下:(1)构建了基于学习的无人机感知与规避系统的自主反应式控制框架。框架涵盖了无人机在规避过程中的感知与动作状态描述,提出了实现该框架所需要的关键模块构建途径,并融入学习机制,通过深度学习实现感知状态的表征与降维,以及利用强化学习构建了感知状态和无人机规避动作之间的映射关系,以实现无人机由感知信息到决策的反应式规避,通过训练和学习以提升无人机在未知环境下的适应能力。(2)提出了无人机传感器前视条件下的显著性目标自主检测算法。受人类视觉注意机制启发,利用无人机机载的单目相机捕获图像,从图像背景和显著目标的幅度谱角度,提出了利用离散余弦变换和离散余弦反变换理论的显著性检测算法,实现了显著目标与背景图像的分割,通过抑制冗余背景的幅度谱,检测出显著性目标。针对特征表征难的问题,论文采用深度学习领域中的卷积网络,搭建了利用图像块进行显著性检测的深度卷积网络,将显著性检测问题转化为分类问题,利用滑动窗口方法实现了图像中的显著目标提取。采用公开数据对显著性检测算法验证,频域信息算法检测效果比通用算法运行时间平均快9.5倍,深度网络的检测效果比通用算法的F_?指标算法平均高出14.3%。(3)提出了利用编码-反编码框架实现对复杂地面环境进行自主表征与深度距离估计算法。利用传统的编码-反编码网络提出多层自动编码网络算法,以及利用卷积与反卷积网络实现对深度距离的估计。地面环境的复杂性对无人机自主规避提出了挑战,首先利用编码-反编码网络搭建了深度自编码网络,实现对环境的表征,但是图像重构的结果忽略了图像中许多细节问题,为了更贴近规避的应用性,论文结合反卷积网络知识,提出了多尺度深度距离估计算法,实现对复杂环境的距离估计,以深度图像作为对于复杂环境的表征,并利用通用数据集验证了算法的有效性。(4)利用强化学习结构构建了无人机视觉感知与无人机规避动作的映射关系。针对值函数估计方法,结合无人机感知状态和动作的表征关系,通过神经网络实现对于值函数估计,通过不断奖励学习实现无人机的规避应用。采用强化学习技术构建了三类学习映射网络(深度Q学习、深度双Q学习以及Actor-Critic架构网络)实现由感知图像到无人机离散、连续动作的映射,主要利用径向基神经网络、深度网络实现对网络中的决策函数拟合,并利用配对数据库实现对映射决策网络的训练,采用半实物仿真环境分别实现了不同算法的验证。