【摘 要】
:
智能驾驶中车辆检测技术这一核心环节,在自主导航、碰撞检测等应用中有着重要的地位。通过输入的传感器数据,车辆检测算法提取环境中的特征,实时检测环境中的车辆目标及其空间位置以及车辆目标当前的姿态,从而合理地对车辆前进路线进行规划。虽然在现有研究下,已经有部分较为成熟的车辆检测算法,但这些算法仅能在光照等环境条件理想的情况下实现车辆检测,并且由于激光雷达本身的限制,远距离目标的点云数据十分稀疏,极大地影
论文部分内容阅读
智能驾驶中车辆检测技术这一核心环节,在自主导航、碰撞检测等应用中有着重要的地位。通过输入的传感器数据,车辆检测算法提取环境中的特征,实时检测环境中的车辆目标及其空间位置以及车辆目标当前的姿态,从而合理地对车辆前进路线进行规划。虽然在现有研究下,已经有部分较为成熟的车辆检测算法,但这些算法仅能在光照等环境条件理想的情况下实现车辆检测,并且由于激光雷达本身的限制,远距离目标的点云数据十分稀疏,极大地影响了现有车辆检测算法对于远距离目标的检测结果,导致现有车辆检测算法对于距离变化的鲁棒性不佳,对远距离目标的检测结果不够精确。目前,车辆检测算法主要分为基于2D图像的车辆检测算法和基于3D点云的车辆检测算法。其中,2D图像具有更高的采样点数量,但是缺乏深度信息,无法准确定位车辆距离。另一方面,3D点云数据具有深度信息,能检测到环境中车辆在空间中的位置与姿态,因此在智能驾驶中得到广泛的应用。但是远距离目标的3D点云十分稀疏,会显著影响检测算法的性能,而且3D点云数据在空间中是非均匀分布,难以直接使用3D神经网络对其进行处理。同时,由于高精度的激光雷达、超声波雷达等3D传感器价格较为高昂,单纯的3D车辆检测算法设备成本较高,限制了算法的应用。为了提高3D车辆检测算法的精度,采用2D车辆检测算法辅助3D车辆检测算法成为了一种解决途径。值得注意的是,现有的3D检测算法对于所有的输入点采用相同的操作,导致了在一些非车辆的局外点特征被保留的情形下,一些车辆点的特征被这些局外点干扰,对检测结果造成不利影响。同时,现有的2D车辆检测算法都是基于2D图像的检测算法,没有考虑与3D车辆检测算法例如Point Net[7]的有效结合。特别地,Point Net等3D车辆检测算法依赖2D车辆检测算法结果,当存在相互遮挡的情况时,2D车辆检测算法的效果不佳,会影响后续的3D车辆检测算法。本文针对3D车辆检测提出了基于多维信息融合与注意力机制的车辆检测算法,该算法分为基于多维信息融合的2D车辆预检测算法与基于注意力机制的3D车辆检测算法两个部分。该算法的主要创新点如下:(1)提出基于多维信息融合的2D车辆预检测模型,该模型能够检测车辆在2D图像上的位置,然后利用2D-3D转换关系来确定车辆在空间中所在锥形区域,进而进行后续3D车辆检测。本文提出算法通过引入3D点云特征来有效约束2D图像中的车辆检测结果能对应上稀疏的3D点云位置,显著提升后续3D车辆检测算法的最终检测准确率。同时,多维信息融合策略将具有深度信息的3D特征引入到2D车辆检测步骤中,能够对于遮挡车辆进行更好的区分,减少了2D检测结果中由于遮挡造成的误检与漏检。该模型通过这两种方式有效提高了最终3D车辆检测结果的准确度。(2)提出基于注意力机制的3D车辆检测模型,通过注意力网络自动计算3D点特征的权重,加强车辆点的贡献,减少非车辆点对检测结果的干扰,从而提升最终的3D车辆检测结果。文中算法将Frustum-Point Net算法作为基础算法实现了上述创新工作,并在KITTI数据集上进行了验证。相比于Frustum-Point Net算法,在准确率上有较明显的提高。同时针对远距离目标,本文提出的算法具有更高的鲁棒性,可广泛应用于各种不同场景。
其他文献
随着“智慧城市”的建设快速发展,近年来我国城市建设和信息化的应用技术水平不断提高,物联网产生的信息量不断增加,如何更快更有效地分配和处理信息是当前一个非常重要的问题。从这个意义上说,信息中心网络(ICN)正是为了满足日益增长的对高效率内容分发的需求而设计的。不同于典型的基于IP的请求机制,物联网中生成的信息可以被视为内容,将物联网内容与名称相关联使用户能够直接请求他们真正想要的内容,此外ICN特有
近年来,深度神经网络在二维图像领域的应用取得了很大的成功,随着三维传感器的普及,机器人可以直接通过深度相机获取深度数据,如何利用三维信息去提升机器人的感知能力也成为了计算机视觉领域的一大热点,本文主要针对机器抓取任务,利用三维信息实现对物体的识别和姿态估计。本文研究物体的机器抓取中的两个核心感知算法,包含三维识别和姿态估计,其中姿态估计是基于标准模型的相对姿态估计。抓取过程中首先需要知道物体的位置
图像属性转换是一项新兴的图像处理技术,其任务是根据使用者需求,对图像中的一种或多种属性进行相应转换,同时保证生成图像的高质量、真实度和多样性。图像属性转换技术的应用十分广泛,涉及电影制片、照片编辑、电子商务等众多行业,也因此成为了当今计算机视觉领域的热门研究课题。早些年间,图像属性转换的主要形式为神经风格迁移,依靠卷积神经网络进行学习。由于传统卷积神经网络需要设立明确的训练目标,所以无法适用于其他
360度视频的高精度和全景特性既给用户带来了沉浸式体验,也使其在现有网络中传输面临巨大的挑战。这种挑战性表现在传输整个360度视频会占用大量的带宽资源,容易引起网络拥堵和造成传输延迟。事实上,当用户佩戴头戴式显示设备观看360度视频时,同一时刻仅能看到一部分视频区域。因此,结合Tiling技术和自适应流传输技术,将360度视频在时间和空间上切片,以Tile粒度传输视频可以节约大量带宽资源。另一方面
视频中的行为识别一直以来都是计算机视觉社区中最热门并且悬而未决的问题之一。行为识别不仅能够直接运用在智能监控,无人驾驶,人机交互等多个领域,并且是许多其他视频研究任务的基础。随着深度学习技术的发展,行为识别这一领域涌现了许多基于深度神经网络的新算法。主流的方法大体上分为3D卷积,双流,循环神经网络三个家族。依靠这些方法,视频的时空特征能够被有效地挖掘和运用。这些模型能够在UCF101,HMDB51
深层页岩气储层岩石组构复杂、非均质性强,基于矿物含量三端元的岩相分类无法精细反映其非均质性变化。利用X射线衍射、物性、薄片、地球化学以及测井等资料,对川南泸州地区五峰组—龙马溪组深层页岩地层开展了以“氧化还原+TOC含量+矿物组分”三重信息为基础的微相细分,分析了不同测井曲线对微相细分类型的敏感性,并采用基于K-means的贝叶斯判别法建立了微相细分类型的测井精细识别方法。结果表明:(1)研究区页
转移肿瘤是指癌症从身体的一个部位扩散到了另一个部位,大约三分之二的癌症患者都会患有骨转移肿瘤,而脊柱是骨转移肿瘤最常见的发病部位,脊柱转移肿瘤可能会引起病人疼痛、脊椎不稳定和神经损伤。因此,脊柱转移肿瘤的早期检测对于疾病的精准分期、改善患者的预后以及最佳治疗方案的选择至关重要。在脊柱转移肿瘤的临床诊疗中,脊椎的检测分割以及骨质质量的诊断分类是两个非常重要的问题。本文针对这两个问题,基于深度学习的方
随着科技的发展,学者的数量也迅速增长,由于学者之间交流频繁,而且学者个人信息在许多领域都有应用,因此如何准确快速地获取学者信息变得非常重要。Acemap作为一个学术大数据平台,目前数据库中还缺少相关学者信息的数据。本文从Acemap的实际情况出发,对使用计算机方法自动从互联网中获取学者信息进行了研究。本文将该过程分成三大部分,分别是网络数据采集、学者主页判别和学者主页信息抽取,对每一部分分别进行了
语义分割是一种细粒度的场景理解任务,在自动驾驶、计算影像等众多应用中起着至关重要的作用。随着深度学习的发展,基于深度模型的语义分割算法也取得了重大的进步。但是由于语义分割需要像素级别的精确标注,相较于分类模型极大地提升了标注的难度和成本,也限制了语义分割任务在新场景的应用和扩展。为此,本文探究在弱监督情况下,即如何在降低数据标注的数量或者质量的情况下,保证分割模型的效果。针对语义分割任务中图像标注