【摘 要】
:
通过视觉实时精确感知机体自身状态和被跟踪目标运动状态,是无人机自主遂行特定任务的重要环节。近年来,基于视觉的目标位置估计研究取得了较为显著的进展和成果。姿态作为另一类空间状态,蕴含着位置无法表征的运动信息,研究位置和姿态的联合估计对于无人机任务能力提升具有重要的理论意义和应用价值。本文以序列图像为基础,分别从广义特征和深度特征两个层面入手,充分利用深度学习等新技术,在数据中挖掘并学习视觉目标的浅层
论文部分内容阅读
通过视觉实时精确感知机体自身状态和被跟踪目标运动状态,是无人机自主遂行特定任务的重要环节。近年来,基于视觉的目标位置估计研究取得了较为显著的进展和成果。姿态作为另一类空间状态,蕴含着位置无法表征的运动信息,研究位置和姿态的联合估计对于无人机任务能力提升具有重要的理论意义和应用价值。本文以序列图像为基础,分别从广义特征和深度特征两个层面入手,充分利用深度学习等新技术,在数据中挖掘并学习视觉目标的浅层及深层特征信息,开展针对无人机相关场景的目标位置和姿态联合估计方法研究。主要工作和研究成果包括:(1)构建了以序列图像为基础的目标位姿联合估计理论架构。剖析了基于视觉的目标位姿估计基本内涵以及研究难点,建立了由序列图像联合估计目标空间位置和姿态的理论框架,提出了以滤波递推为主体框架的目标位姿估计方案,并分别从传统的空间几何和新兴的深度学习两个角度揭示了目标位姿估计算法原理,为基于视觉的目标位姿估计问题提供了新的研究思路和方案。(2)建立了空间几何广义特征驱动的目标位姿滤波估计模型。以目标空间几何约束关系为基础,建立了目标位姿滤波估计预测方程和测量方程,从理论上证明了视觉位姿估计滤波模型的最优性。滤波模型充分利用了序列图像的时域关联,物理含义明确、可解释性较强,其严格的推导过程为获得精确的位姿估计结果奠定了基础。通过仿真算例验证,与经典方法相比,提出的位姿滤波估计方法不仅运行速度提高了约1倍,而且位姿估计的误差降低了约38%。(3)提出了空间目标锚点广义特征多分辨率深度学习检测方法。针对基于广义几何特征的目标位姿滤波估计模型的观测量需求,设计了目标锚点广义几何特征,建立了典型空间目标锚点构型选取准则,设计了基于区域分块的多分辨率锚点深度学习检测算法。仿真验证结果表明,基于区域分块的多分辨率锚点检测算法达到了98.7%的准确率,同传统的单通道锚点检测框架相比,提升了约5%;(4)构建了深度特征驱动的目标位姿端到端估计模型。设计了以神经网络为基础的目标位姿端到端估计模型,充分结合卷积神经网络的视觉特征提取表征能力和循环神经网络的历史状态记忆能力,构建了混合型目标位姿端到端估计神经网络,实现了位姿估计的高度集成化,降低了算法的参数调试成本。通过仿真验证了端到端估计算法对不同应用场景的强适应性,通过与经典端到端位姿估计网络的性能对比,在不降低算法运行速度的前提下,位置和姿态估计误差分别降低了约24%和21%。(5)设计了位姿估计端到端模型观测量转换参数解算方法。针对目标位姿端到端估计模型观测量对转换参数的需求,提出了视觉系统摄像机-云台-里程计外参数优化方法。该方法同时支持离线人工辅助模式和在线全自主模式,具有较强的应用场景适应性。针对典型应用场景的仿真与实验,验证了外参数优化过程的收敛性,以优化的外参数为基础,平均重建误差低于3 m,仅为目标距离的2.6%。(6)构建了序列图像目标位姿估计研究及综合验证原型系统,开展了目标位姿估计算法的实物综合验证。以地基视觉无人机降落自身状态监测和机载视觉地面目标自动追踪为应用验证场景,构建了实物验证原型系统,分别对广义特征和深度特征驱动的目标位姿估计方法进行了综合验证,实验结果表明,在经典的位姿估计方法基础上,广义特征目标位姿估计算法的平均耗时降低了近90 ms,且位姿估计精度取得了32%的提升;深度特征目标位姿估计算法分别在位置估计和姿态估计取得了14%的精度提升。上述研究工作和成果探索了从视觉序列图像到目标位姿的理论、模型、算法、验证等全链条研究,为人工智能技术与无人机系统的有机融合奠定了基础。
其他文献
区块链是在分散对等的协作主体之间就共同关注的数字证据达成共识,并在此基础上开展合作的分布式存证机制,具有多中心、防篡改、可追溯等基本特性,能够以低成本、高效率的方式为不具备信任关系的各利益主体构建信任,并促成群体之间的高效协作。区块链技术不仅能够以分布式账本的形式对金融行业发挥重要作用,而且在数据共享、信息安全等众多领域也有广泛的应用前景。共识技术作为区块链的核心技术之一,逐渐成为了学术界和工业界
目前,医学数据正在急剧增长,来自区域医疗诸多医院的病历文本数据、医学检验数据和影像数据迅速汇聚,为疾病的筛查、诊断和治疗带来曙光。医学文本数据尤其是电子病历数据,记录了患者详细的病情和治疗过程,所含信息丰富,因此,开展医学文本挖掘中关键技术的研究,提取与某疾病相关的特征并构建相应的知识图谱,可更加科学、客观地预防、筛查疾病并给出合理的治疗方案,最终为广大患者提供更好的医疗服务,具有很好的理论和实际
运动实体广泛存在于攻防体系对抗实验等军事分析仿真应用中,其连续运动行为导致时空状态更新占据了应用大部分的通信内容,成为影响和制约运行效率的关键因素。传统的通信优化技术主要面向于提高数据传输速度或过滤冗余通信链路,并不能有效解决大规模时空数据传输引起的通信瓶颈问题。因此,开展以减少时空状态信息通信量为目标的相关技术研究,对于提高通信性能,有效利用现有的计算和通信资源,满足军事分析仿真日益增长的性能需
人脑在多个时空尺度的信息交互是支撑其复杂认知和行为功能的基础,我们尝试利用磁共振成像非侵入式和较高时空分辨率的特点,研究人脑的神经信息交互机理。本文主要以静息状态下人脑的功能连接为对象,进行人脑在多时空尺度下的功能单元划分及其交互模式研究,同时探寻其结构基础。本文主要包含以下三个方面的内容:(1)人脑功能剖分方法研究。人脑的功能单元具有明显的层次性,他们之间通过复杂的功能分离和整合来完成特定的认知
在当今社会,随着传感器和计算机视觉技术的发展,人们对视频监控自动化和智能化技术有了更多的需求和研究。前景检测作为计算机视觉领域的基础技术,目的是将运动的前景物体从相对静止的背景场景中分离出来,是计算机视觉分析理解任务中的第一个问题。由于应用场景的复杂性,目前传统前景检测算法性能面临瓶颈。提高算法准确性、增强算法实时应用能力,以及提高算法鲁棒性是前景检测技术的研究重点。本文首先针对阴影和颜色伪装等应
随着计算机技术、多媒体存储技术的发展,人们的生活中充斥着海量多媒体数据,这些多媒体数据包括图像、文本、语音、视频等不同的模态。面对海量多模态数据,如何快速、有效的从中检索出感兴趣信息,是一项亟待解决的重要问题。单模态检索与跨模态检索是解决多模态数据检索的重要研究方向。哈希技术因其低存储消耗、高检索速度成为海量数据检索的研究热点,在单模态与跨模态检索研究领域得到广泛的研究与发展。本文研究单模态与跨模
穿透散射介质的光学成像技术是近年来光学计算成像领域的重点研究方向之一,在军事侦察、消防搜救、汽车自动驾驶、水下成像、医学探测等领域有着重要的应用前景。现有多种用于穿透强散射介质成像的散射成像技术,都有不同优缺点,其中基于光学相位恢复的散射成像技术具有更好的发展前景,有望实现大视场、远距离、高质量的穿透成像。针对现有基于光学相位恢复的散射成像技术普遍存在的问题,本文从光学相位恢复方法的两种代表性技术
隐身战斗机、小型无人机等弱目标的出现给防空系统造成了严重的威胁,针对弱目标的联合检测跟踪技术研究也因而成为当前理论研究的前沿和热点。检测前跟踪,区别于传统的先检测后跟踪方法,能够利用多帧观测数据,不断累积目标信息,进而达到增强目标强度的目的。本文针对检测前跟踪算法在多种场景下的运用做了大量的研究,研究内容主要包括以下几个部分:第二章利用贝叶斯理论构建了统一的目标跟踪推理框架,为跟踪算法的推导作了理
当前,计算机技术发展日新月异,随着医疗器械的配套更新,医学图像的数据也越来越丰富。面向医学图像的处理和分析能够对医生的诊断和治疗起到辅助、启发和推动作用。医学图像分割是医学图像处理的基础技术,可以根据应用需求,对医学图像中的兴趣区域进行像素级的标记。医学图像的成像方式繁杂,图像特征各异,同时,不同成像方式下的医学图像可能会针对不同人体部位,这些都导致了医学图像分割需要针对不同成像方式的数据构建不同
随着信息技术的高速发展,爆炸式增长的信息对人们处理信息的技术提出了更高的要求,现在技术无法有效满足信息利用的时效性。自动文本摘要作为一种减轻信息过载、提高信息利用效率的技术,在实践中有着广泛的应用,如自动生成新闻文章和技术文章的标题、摘要,自动生成搜索引擎检索结果的概述,写稿机器人等。在上个世纪90年代以前,自动文本摘要以无监督技术为主,由于缺乏有效的监督机制,并受限于当时的计算资源,这些方法通常