【摘 要】
:
基于图像的三维物体定位,是近几年来计算机视觉领域的一个热门研究问题。对已知三维几何模型的物体实例,其目标是要求出物体在图像上的六自由度精确位姿参数,使得三维模型在图像上的投影能够与图像上的目标区域精确配准。对输入为视频的情况,可以基于视频的连续性,对物体在视频中的三维位姿进行跟踪,获得物体在每一帧的位姿参数。现有的三维物体跟踪的方法可以分为基于优化的方法和基于深度学习的方法。基于深度学习的方法利用
论文部分内容阅读
基于图像的三维物体定位,是近几年来计算机视觉领域的一个热门研究问题。对已知三维几何模型的物体实例,其目标是要求出物体在图像上的六自由度精确位姿参数,使得三维模型在图像上的投影能够与图像上的目标区域精确配准。对输入为视频的情况,可以基于视频的连续性,对物体在视频中的三维位姿进行跟踪,获得物体在每一帧的位姿参数。现有的三维物体跟踪的方法可以分为基于优化的方法和基于深度学习的方法。基于深度学习的方法利用GPU强大的功能和对特定物体对象进行长时间的训练,从而达到较好的鲁棒性,但是在训练网络的过程中需要花费较大的计算量。而基于优化的方法具有精度高、速度快的特点,但由于局部极小值的存在,对较大的帧间位移非常敏感,在实际环境下容易因相机或物体的快速运动而导致跟踪失败。针对该问题,本文提出了一种预计算的鲁棒的轮廓跟踪方法。通过使用多个候选对应的长搜索线,可以更好地适应不同的帧位移,而不需要采用现有方法中从粗到精的搜索方式。在预计算之后,可以非常快速地进行位姿的更新,从而达到实时的非局部优化。本文还对近几年的基于优化的三维物体跟踪方法进行比较和分析,发现了准确率下降和容易收敛到局部极小值主要是由平面外旋转所引起的。根据此现象,本文提出了一种快速有效的非局部三维跟踪方法。而对于局部优化和非局部优化问题,本文提出了一种以非局部优化为主,同时在其中使用快速局部优化的方法,将不同参数的非局部优化和局部优化相结合,从而在六自由度空间中实现高效的非局部搜索。此外,对于小位移和大位移,本文的方法都优于所有之前的方法,甚至在本文仅使用局部优化而不使用非局部优化时,效果也优于之前的方法。并且在大位移的情况下,之前的方法的准确率急剧下降,而本文的方法能保持较为稳定的准确率。同时,本文的方法只需CPU即可实现实时的速度(>50fps),可以有效提高视频设备上三维跟踪的稳定性。
其他文献
图被广泛应用于各种领域的关系建模,比如社会学、生物信息学、基础设施、万维网等。现实生活中的图通常是全局稀疏,但局部紧密,也就是平均度数往往相当小。因此,如何在一个大规模的图网络中挖掘出这些紧密子图是一个非常热门的研究课题,它可以帮助人们找到图中的关键节点或者群体。目前的研究中已经给出了很多的紧密子图模型,比如k-core、k-truss、clique等,但这些都只是考虑图的拓扑结构。而真实的网络图
随着智能设备的普及,群智感知逐渐成为一种普适感知新范式。群智感知基于众包理念,其充分利用大量拥有智能设备、具备感知能力的个体,实现海量异构数据的采集,解决大规模数据需求问题。与传统的传感器网络相比,群智感知系统不需要大量部署专门的传感器设备即可获取海量感知数据,大大降低了数据获取的成本。目前,群智感知已经被广泛的应用在对现实物理世界的感知中(如交通信息采集、空气质量监测、城市WiFi勘测等)。尽管
随着计算机视觉方向的研究日渐深入,社会安全对计算机视觉技术的需求不断增长,智能安防成为城市安全防护的重要手段。传统的人脸识别虽然可以通过人脸信息来定位人的身份,但是却无法在模糊的监控影像中对整个人体起作用。行人重识别正是解决此难点关键的研究方向之一,这种技术被用来对画面中的行人进行再识别,以确定每个人的身份信息。行人重识别是一项具有挑战性的图像检索问题。由于实际场景复杂多变,行人的前景和背景无法被
植物能够通过改变各种功能性状和资源分配模式,产生多种应对不同胁迫或干扰环境的生态策略。植物生态策略研究对于解答植被演替、生物多样性保护、生态系统功能维持及全球环境变化响应等生态学前沿热点问题具有重要意义,但现有研究多聚焦于植物种间水平的宏观分析,对植物生态策略的遗传与环境驱动机制的了解相对较少,特别是缺乏对种内遗传谱系分化作用的研究,限制了生态策略的机理探究与应用推广。本研究通过将野外调查和多年同
计算机辅助设计(Computer Aided Design,CAD)广泛应用于我国诸多行业中。目前我国的CAD几何引擎技术落后于国外,CAD市场更是处于被国外垄断的状态。为了摆脱该现状,我国需要早日开发出完全由中国自主研发的CAD几何引擎并广泛投入使用。为了开发出中国自主研发的CAD几何引擎,我国早已将对产品数据模型表达与交换标准(Standard Exchange of Product data
参数曲线和曲面是计算机辅助设计应用的重要出发点,通常情况下,渲染、求交以及裁剪曲线和曲面等相关应用的算法是基于它们的参数化而不是固有的几何形状。曲面可以有许多不同的参数化形式,根据实际的应用选择合适的参数化对曲面进行重新参数化往往能得到较为理想的结果。应用结果会受到曲面参数化质量的影响,比如在曲面离散、曲面求交、曲面纹理映射、曲面渲染、曲面配准等应用中,曲面参数的一些诸如正交性等性质能够带来更加稳
随着国内物流行业的发展,商用车数量持续上涨,运输危化品、易燃易爆特征材料的商用车需要确保运输过程的安全性,运输普通货物的商用车需要确保货物能够及时到达目的地,因此故障预警变得至关重要。故障预警可以提前预知设备未来的运行状况并及时反馈,提示操作人员设备已出现故障征兆,有助于操作人员及时采取预防性维护或维修,使设备始终处于良好的运行状态,避免因故障造成的严重灾难,减少因故障带来的严重损失。目前的故障预
随着互联网的飞速发展,信息呈现爆发式增长,从海量信息中获取用户所需信息的智能问答系统也应运而生。不同于搜索引擎那样需要用户自己搜索并整合相关信息得到问题的答案,用户通过问答系统提出问题便可得到简单准确的回答,能够满足用户快速获取问题答案的需求。问答系统在实践中有着广泛应用,特别是限定领域的问答系统,在实际社会生产中能够为用户快速提供该领域专业且准确的回答。早期的问答系统大多基于规则模型和统计模型实
科学研究过程中涉及到大量标量场数据的表达与理解,举例而言,全球海洋盐度的分布、医学中人体骨骼分布等。在利用可视化技术探索标量场数据的过程中,色彩是不可或缺的视觉编码元素,通过建立色彩与数值之间的关联关系可生成视觉信息丰富的可视化图像,帮助用户探究不同标量场数据中的隐藏特征,从而,实现高效数据理解、分析和决策。尽管现有的可视化工具提供了大量的色彩表,如彩虹色彩表、灰度色彩表等;但是不同色彩表所呈现出
“审美鉴赏与创造”作为语文学科四大核心素养之一,已被列入《普通高中语文课程标准(2017年版2020年修订)》,可见审美教学在语文教学中的重要性。此外“整本书阅读与研讨”也被列为高中语文课程体系的“十八个任务群”之一,“整本书阅读”成为语文教学的一大热点。《红楼梦》作为一部经典名著,其蕴含着丰富的美育资源,是审美教育的一个重要“载体”,在语文教育中发挥着至关重要的作用。《红楼梦》整本书审美鉴赏教学