基于深度学习和几何约束的3D目标检测算法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:googoosin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
单目3D目标检测是自动驾驶领域的一个重要课题。现有的单目3D目标检测算法通常基于完全的深度学习方案。同时往往只针对训练样本数量较多的类别,如汽车(Car)等进行训练,而对于其他样本量少的类别,如骑自行车人(Cyclist)等不予过多关注,或者运用效果不甚理想。对于需要完成空间推理的网络而言,样本的数量对成功训练网络起到了极大的作用。即使采用数据增广等方式进行扩充,网络在检测2D时效果相对明显,但推理3D结果时往往收效甚微。而在实际的自动驾驶场景中,这些类别的正确检测同样至关重要。另一个方面,大多数的算法寄希望于网络能隐式地学习到二维图片至三维物体间的映射关系,而不太关注其中的成像约束。但显式地应用立体视觉几何约束也是3D目标检测的一个重要思路。因此,本文关注自动驾驶场景中样本量稀少的类别,针对上述问题,通过应用三维物体与二维图片的几何约束,提出一套独特的多阶段3D目标检测方案。做法主要包含两阶段,在第一阶段中采用2D目标检测算法获取物体的2D包围盒,在第二阶段中基于2D结果完成3D包围盒的推导。本文将第二阶段推导3D包围盒的属性继续拆分为两个步骤。其中第一步骤为利用视觉检索方法来回归3D包围盒的尺寸和朝向等属性,而第二步骤则基于前述2D结果和3D属性,通过立体视觉几何约束完成3D包围盒三维坐标的推导。最后融合两部分结果得到完整的3D包围盒表述。在第二阶段的第二步骤,本文实际上采用了三种推导3D结果的方式。通过构建几何约束的方式显示地应用成像关系,直接完成3D结果的推导,极大减少了对样本数据量的依赖,十分适用于样本量稀少的类别。最后,本文在自动驾驶数据集上验证了本文提出的方案,通过与榜单上现有的典型算法进行对比,验证了本文算法的有效性。
其他文献
自全国人大常委会授权最高人民检察院提起公益诉讼试点起,公益诉讼领域从理论到实践都得到了不断的完善。公益诉讼线索发现是办理案件的前提和先决条件,线索的数量与质量决定办案的最终效果。借助文本挖掘技术通过监控网络数据拓宽公益诉讼线索来源渠道,促进“互联网+司法”的发展,网络文本作为一种重要的数据承载形式也是发现公益诉讼线索的切入点。本文立足于检察机关视角,以某省公益诉讼办案指挥中心平台建设项目为背景,主
固定化金属离子亲和色谱技术被广泛应用于重组蛋白纯化、修饰蛋白及多肽的富集、废水处理以及分子间相互作用研究等众多领域,效果卓著。但目前被广泛使用的金属离子类型主要局限于镍、铜、锌等少数金属离子。该技术在其他金属离子亲和色谱类型方面的广泛应用还有待研究拓展。铅是水环境污染中常见的重金属元素,毒性显著,极易被人体吸收和富集,对机体多个系统造成严重损伤。铅过量摄入引起中毒事件时有发生,特别是儿童铅超标现象
合成孔径雷达(Synthetic Aperture Radar,SAR)和逆合成孔径雷达(Inverse SAR,ISAR)因其能够全天时、全天候地获取目标高分辨图像的能力,是我国近年来实现领土海域的监控和对舰船实时侦察的一种重要手段,已经成为各国学者的研究热点。相比于固定翼SAR/ISAR成像平台,直升机平台因其具有垂直起降、贴地飞行、在不平整的地段着陆以及在空中悬停等优点,在民用和国防领域应用
科学技术的蓬勃发展带来应用种类的百花齐放,却也导致数据规模的爆发式增长,如何处理大数据成为信息时代的一项亟需解决的关键问题。由于传统的集中式处理系统在面对高并发、大流量的新型数据面前显得愈发力不从心,分布式计算系统逐渐取代其成为主流的大数据处理方式。由此,本文提出了一种基于可分负载调度的分布式大数据加速原型,以解决在任意网络拓扑结构下的分布式处理系统中网络带宽和计算资源分配的问题。本文主要分为两大
二氧化碳是温室气体,通过二氧化碳回收利用来减少工业过程中的碳排放对环境保护非常重要。现有二氧化碳回收技术大多着重于二氧化碳捕集率,而较少关注二氧化碳产品的纯度。本文对精馏法制取高纯二氧化碳工艺进行研究。二氧化碳排放气的来源有烟道气、石灰窑气、发酵尾气和制氢尾气等。根据不同来源的气体中各组分与二氧化碳之间的汽液平衡数据,对比选择合适的热力学计算模型。基于组分特点分析,提出分离纯化过程需特殊处理的杂质
最近,在大数据和从数据流中学习的情况下,增量学习和在线学习越来越受到关注,这与传统的完全数据可用性假设相冲突。一般来说,传统的假设是所有任务的训练数据始终可用。然而在实际应用中,在构建统一的视觉系统或逐步向系统中添加新功能时,如果涉及连续输入数据流的在线服务。任务数量不断增加,对此类数据进行存储和重新训练变得不可行,增量学习被认为是解决上述实际挑战的有希望的解决方案。研究表明,增量学习存在一个基本
钛合金因其高比强度、耐腐蚀性能、生物相容性,已广泛应用于航空航天、生物医学、石油化工等领域,但钛合金的低耐磨性限制其进一步应用。目前常在钛合金表面电镀镍、铜、铬等金属层以提高钛合金耐磨性。但由于镀层以机械结合的方式与基体结合,其结合性能不足,镀层服役寿命有限。研究者利用镀后扩散热处理强化电镀Ni与Ti-6Al-4V(TC4)基体的结合性能,并采用划格法、挫削法等检测Ni镀层结合性能,然而这类定性镀
分布式压缩感知建立在压缩感知理论基础上,既能利用信号内的相关性又能挖掘信号间的相关性,可以提高信号的重构精度,在图像处理等领域有着广泛的应用。作为图像处理的一个重要分支,图像融合因其广阔的应用前景,吸引了国内外研究学者的广泛关注。鉴于同一场景的待融合源图像间存在着很强的相关性,本论文通过引入分布式压缩感知挖掘图像的相关性进而实现图像融合,具体工作如下:1、多聚焦图像融合旨在识别同一场景下多张单聚焦
在工业互联网背景下,工业控制网络对各要素之间的互连互通提出了更高的要求,工业以太网协议标准不统一、彼此之间不能兼容的问题日益突出。为此,IEEE802任务组发布了一系列时间敏感网络标准,为工业以太网协议建立了一套通用的时间确定性机制。作为时间敏感网络标准中最重要的协议之一,IEEE 802.1AS协议缺乏固有的安全机制,存在极大的安全隐患。在该背景下,本文针对IEEE 802.1AS协议的安全性问
随着新课程改革的实施和有序推进,如何有效提高音乐课程特别是小学阶段教学效率、实现新课标教学三个维度的目标、全面提高学生音乐素养,成为了音乐教师教学实践中关注的主要问题。众所周知,视唱练耳作为音乐教学中的重要环节,在培养学生的听觉能力、音乐感知能力、作品鉴赏能力方面发挥着不可替代的作用。通过笔者调查发现,有相当一部分小学教师在视唱练耳课程教学中往往直奔主题,直接进入到歌曲的学唱环节,忽视或无视视唱练