【摘 要】
:
随着3D传感器的技术发展,众多3D点云相关的计算机视觉任务应运而生,其中3D场景理解任务面临着众多挑战。在过去的几年中,使用深度神经网络对点云进行3D目标检测和场景分类逐渐成为主流方法,然而传统神经网络只通过形状特征来辨别物体和场景,未考虑到物体与场景之间的关联性。本文通过贝叶斯神经网络的方法,为3D目标检测赋予预测不确定性的能力,通过贝叶斯信念网对场景进行推理,并对目标检测的结果合理性进行验证,
论文部分内容阅读
随着3D传感器的技术发展,众多3D点云相关的计算机视觉任务应运而生,其中3D场景理解任务面临着众多挑战。在过去的几年中,使用深度神经网络对点云进行3D目标检测和场景分类逐渐成为主流方法,然而传统神经网络只通过形状特征来辨别物体和场景,未考虑到物体与场景之间的关联性。本文通过贝叶斯神经网络的方法,为3D目标检测赋予预测不确定性的能力,通过贝叶斯信念网对场景进行推理,并对目标检测的结果合理性进行验证,从而减少了3D目标检测不合理的输出,并为场景分类增加了可解释性。针对传统3D目标检测模型无法对不确定性进行评估的问题,本文根据贝叶斯神经网络的原理,对Group-Free 3D目标检测模型进行了改进,提出了Bayes GF3D模型,使得点云的目标检测模型具有预测不确定性的能力。此外,本文提出了贝叶斯卷积层的概念,并对贝叶斯全连接层的计算方式进行了改进。在实验中,Bayes GF3D模型可以在不显著降低精度的情况下,有效地对物体的不确定性进行预测。本文还对点云中目标检测的不确定性的影响因素进行了探讨。针对使用物体类别对场景进行推理的问题,提出了基于贝叶斯信念网的3D点云室内场景概率图模型,通过选择高频物体和构造局部场景这两种优化方案,贝叶斯信念网可以高效地通过观测到的物体证据预测室内场景的类别。针对传统神经网络无法充分利用场景的上下文信息的问题,提出了一种以物体和场景的联系为核心的场景理解模型,通过目标检测结果与推断出的场景之间的概率联系,对目标检测的结果进行合理性验证,从而提升了3D点云目标检测的精度,并且得到了一个可解释的场景理解模型。本文提出的对点云室内场景理解的模型可以有效地滤除在3D目标检测中不符合环境上下文的检测结果,从而提升目标检测的精度,并且为场景的分类任务提出了一个可解释的模型。
其他文献
随着计算机视觉领域的发展,一系列依赖于计算机视觉的应用场景和解决方案纷纷涌现,如自动驾驶、智慧安防等等。这些智能应用技术都离不开计算机视觉中的目标检测这个关键任务。目标检测任务根据输入信息源可以分为多类,本文旨在研究二维图像中的目标检测。该任务可以描述为给定二维图像,输出其中存在的已知类别的目标实例的类别及位置。现有的代表性目标检测方法大都仅仅依靠目标区域的局部特征独立地对每个候选目标进行检测。这
行人检测作为一种计算机视觉任务,能够及时对成像设备产生的图像进行分析处理,为针对行人的后续任务做出保障。由于其在无人驾驶,安全等方面具有重大意义,因此受到了广泛的研究与应用。传统的行人检测方法往往基于单模态的输入数据,如可见光图像,红外图像等。然而单模态数据在特定条件下常常存在缺陷,在处理复杂环境条件下的行人目标时,往往无法获取明确的行人信息,从而使得基于单一模态的行人检测存在较高的漏检以及虚警率
随着遥感技术的飞速发展,遥感卫星捕捉到的视频数据包含了更丰富的地物信息,能更有效地完成城市交通管理、海洋监测、智慧城市等任务。然而,在遥感视频中跟踪对象并非易事。首先,遥感视频通常存在分辨率低、对比度低、视野宽的特性,这意味着视频中的物体密集且相互干扰,因此网络很难提取有效的特征。此外,目前主流的基于孪生神经网络的跟踪方法用于匹配模板和搜索框特征的互相关操作是一个局部线性匹配过程,容易导致语义信息
恒定导通时间(COT)控制的开关电源凭借快速瞬态响应的优点迎来了日益增长的市场需求与研究热度,被广泛用于电信设备、计算机、服务器、汽车电子等众多领域。但传统COT控制的工作原理决定了其存在输出电压精度低、开关频率大幅变化引发电磁干扰等缺陷。在高压宽输入范围的转换器中,大幅变化的占空比使得上述缺陷更为显著。顺应高精度输出电压与高精度开关频率的发展趋势,本文研究了相关理论与现有改进技术,提出了创新的输
近年来,随着人工智能、即时通讯和智能手机的发展,互联网中的各种数据处于指数级增长的状态。特别是对于一些UGC(User-Generated Content,用户生产内容,也称UCC)平台,用户可以随时随地将自己创作的图片、视频或音频等不同类型的多媒体数据上传到软件平台上。因此,如何高效、准确地从海量的多媒体数据中检索出用户需要的内容是一个具有应用价值却又极具挑战性的问题。因为不同模态数据的底层特征
随着晶体管尺寸逐渐接近物理极限,高速集成电路设计面临的问题及挑战也越来越多,使得集成电路的性能和集成速度逐渐放缓。而三维集成技术由于其集成度更高、互连延迟更低并且可以实现异质集成而得到了广泛研究。其中,硅通孔(Through Silicon Via,TSV)的研究已经变成一个重要课题。虽然TSV的引入存在许多优点,但会给系统的电源完整性带来影响。例如,TSV的大量应用会为系统引入额外的面积,同时,
近年来,随着BCD工艺的发展,智能功率集成电路(SPIC)逐渐在汽车电子,航天航空,智能家居等领域发挥重要作用。电机驱动电路作为智能功率集成电路的核心模块,正不断朝着低成本,高可靠性和高集成度等方向发展,在中小功率设备中广泛使用并且不可或缺,市场前景非常广阔。如今我国正大力发展集成电路行业,对集成电机驱动电路的研究必不可少。本文从研究小功率电机桥式驱动器集成电路设计出发,围绕提高系统集成度,针对芯
在早期研究中,隐身飞机能够凭借其低可探测性来进行战区突防,完成防空区域中的侦察、支援、打击等任务。随着反隐身技术不断发展,如今单纯依靠隐身飞机自身的低可探测性已经难以完成作战任务。为了提高隐身飞机的作战效率,需要建立防空雷达的探测概率模型,根据模型规划出一条适合隐身飞机的航路。该航路不能有超过探测概率阈值的航路点,还要满足隐身飞机的基本机动性能约束。由于实际的战场环境复杂多变,对不同场景下的隐身飞
随着知识图谱在学术界和工业界的广泛研究和普遍应用,完善与更新知识图谱数据,提升知识图谱质量成为亟不可待的任务,知识表示学习作为知识图谱补全重要的上游技术越来越受到人们的关注。知识表示学习的目标是将知识图中实体和关系嵌入到向量空间中,使它们的语义关联以可计算的形式更好地表达。知识表示学习广泛应用于实体/关系预测与补全等场景。大多数知识表示学习模型基于图结构本身的实体/关系信息,如翻译模型、卷积/图神
视觉目标跟踪是计算机视觉的基础研究问题之一,被广泛应用于智能交通、自动驾驶和安防监控等领域,具有巨大的社会和经济价值。深度学习在计算机视觉领域的成功极大推动了目标跟踪技术的发展,其中基于孪生网络的目标跟踪算法将跟踪任务转化为图像间的相似性匹配过程,兼具实时性和准确性而备受关注。由于遮挡、干扰物和视角变换会导致目标外观特征不稳定,而孪生网络跟踪方法仅根据初始帧目标来匹配后续图像,难以有效区分干扰物和