论文部分内容阅读
近年来,激光雷达(Light Detection and Ranging,LiDAR)逐渐成为诸多实际应用中不可或缺的一部分,例如自动驾驶汽车,移动机器人,无人机等。LiDAR可以精确地获取周围环境的三维表征,即三维(Three Dimensional,3D)LiDAR点云。LiDAR点云由点的几何信息(三维坐标)和对应的属性信息(反射强度)构成,具有稀疏、无序、大数据量的特点。以常用的激光雷达Velodyne HDL-64E为例,其每秒钟产生的点数高达两百多万个。传输及存储如此海量的数据,无疑给有限的网络带宽和存储设备带来巨大的压力,从而极大地阻碍了 LiDAR相关应用的发展和点云相关技术的落地。因此,探索如何高效地编码LiDAR点云成为学术界和工业界亟需解决的问题,具有重要的研究及应用价值。LiDAR点云时空域编码研究主要包含帧内预测与帧间预测两个方面。其中,前者旨在基于当前帧内几何和属性信息的相关性进行预测,从而去除点云的空域冗余;而后者则旨在基于连续帧之间几何和属性信息的相关性进行预测,从而去除点云的时域冗余。本文研究了点云几何信息的帧内预测、帧间预测以及浮点编码三个方面的关键技术,并取得了一些初步成果。这些研究成果已在自动驾驶的同步定位与建图任务中得到了初步的应用,有效地减少了点云数据传输和存储的成本,并提高了定位的性能。具体地,本研究的主要内容包括以下几个方面:1.基于语义先验表征的LiDAR点云空域编码框架。构建适用于实际应用的LiDAR点云编码框架主要面临以下3个挑战:基于树的表征方法对于稀疏的LiDAR点云来说较为低效、现有算法忽略了机器感知性能以及如何在不引入过多计算复杂度的情况下,将神经网络模型集成到点云压缩框架中并进一步提高编码效率。针对上述挑战,本文提出了一种基于语义先验表征的LiDAR点云空域编码新框架。通过采用数据降维(点云的2D距离图表征)降低后续处理的计算复杂度并去除了部分表征冗余。一方面提出了一种语义先验表征,通过对2D距离图进行实例分割获取语义标签作为指导帧内预测的先验信息,进一步提高帧内预测的效率。通过对语义先验表征而非对点云的三维坐标进行编码的方式,降低了编码数据量从而提高了编码的效率。另一方面设计了一种机器感知模式,可基于语义信息去除对解码端定位不利的点,从而提高解码端的定位性能。同时,结合语义先验表征编码器,能够保留数据在实际应用中所需的高精度,实现LiDAR点云的编码性能以及在实际应用中SLAM定位性能的大幅提升。2.基于2D流估计的LiDAR点云帧预测算法。由于LiDAR点云稀疏、无序的特点,其在3D空间内的运动估计和运动补偿是一个较难的问题,目前业界仍没有一个较为成熟的解决方案。为了解决该问题,提出了基于2D流估计的帧预测模型。结合3D LiDAR点云的2D距离图表征,通过设计面向稀疏距离图序列的流估计器实现运动估计,从而基于双向距离图和流信息合成中间帧。之后,通过逆映射以实现3D点云的双向帧预测。3.基于3D时空卷积的LiDAR点云帧预测算法。基于2D流估计的方法仍存在着以下问题:(1)忽略了场景中物体的特征分布,导致普通卷积特征提取低效;(2)过度依赖流估计的质量,导致算法鲁棒性差;(3)LiDAR距离图序列的时域关系比视频弱,导致流估计低效;(4)流估计算法计算复杂度较高,导致帧预测模型很难和点云编码框架实现有机的结合。针对上述问题,提出了一种轻量级的基于3D时空卷积的LiDAR点云帧预测模型。首先,针对挑战(1),通过引入非对称残差块以更好地提取实际场景中物体的空域特征。其次,针对挑战(2)(3)(4),引入3D时空卷积以学习LiDAR图序列的时域特征并进一步融合时空域特征,从而快速准确地合成预测帧,并提高了算法的鲁棒性。4.基于双向帧预测的LiDAR点云时空域编码框架。现有的方法通常仅考虑LiDAR点云的空域冗余和信息熵冗余,忽略了时域冗余。其次,LiDAR点云实际应用场景的实时性需求加大了时空域编码的难度,即要求编码算法在保证数据保留一定精度的同时,还能实现较快的运行速度。再者,现有的基于2D域的编码方法大多采用图像/视频编码器进行编码,忽略了 LiDAR点云2D表征与普通图像在特征分布和像素精度上的不同,从而导致编码效率较低。为解决上述难题,首先,基于所提出的轻量级LiDAR点云帧预测模型进行改进,从而实现帧间预测。其次,提出了一种距离自适应的浮点编码器,能够基于输入浮点数的特征分布进行自适应的编码,实现快速准确地编码距离图的相关数据,从而联合地去除数据的空域冗余和信息熵冗余。整个框架将之前的研究工作有机地结合在一起,实现了实时地去除LiDAR点云的时域、空域和信息熵冗余,同时进一步提高了解码端SLAM的定位性能。