论文部分内容阅读
三维激光点云数据的场景理解是计算机视觉领域重要的研究内容,本文主要研究了基于室外三维激光点云数据的分类问题,并提出了两种分类算法。本文提出了全景方位角(Panorama Bear Angle,PBA)图模型结构,首先将三维激光点云投影到以视点为球心的球面模型上,建立三维激光测距点与二维图像像素间的对应关系。然后利用激光测距点在三维空间中的相对位置关系计算其所对应像素灰度值。PBA图克服了传统图模型结构依赖三维激光点云结构化输入的局限性,并且解决了传统图模型结构灰度渐变和细节刻画能力弱等问题,为本文后续的特征提取和图像分割提供了保证。 在第一种分类算法中,本文首先利用图像金字塔模型提取了PBA图在多个尺度上纹理特征。然后本文通过图像金字塔模型衍生出“点云金字塔”模型,借助点云金字塔模型提取了三维激光点云在多个尺度上的局部特征。随后采用随机森林分类器对已提取的高维特征进行特征筛选,以实现对三维激光点云数据的初分类。而后对PBA图进行了超像素分割,在每个超像素块内根据初分类的结果进行再分类,以矫正部分错分点,使分类精度得到进一步提升。 在第二种分类方法中,本文借助卷积神经网络完成三维激光点云特征的自动提取。首先在视点所在的水平面上选取多个视角方向,根据针孔相机模型将激光测距点投影到各个视角所对应平面上,按照特定的颜色映射算法生成每个视角所对应的二维图像,然后将这组图像作为全卷积神经网络模型的输入。完成图像的语义分割后,将结果反映射回三维激光点云中,即可得到每个激光测距点的类别标签。这与直接处理三维激光点云的神经网络相比,在效率和资源利用率上具有明显优势。 本文选取苏黎世联邦理工学院(ETH Zurich)和国立巴黎高等矿业学校(MINESParisTech)公开的三维激光点云数据集对上述两种分类算法进行验证,并将验证结果与国外研究小组的成果进行了对比。结果显示,本文的两种分类策略在分类精度和分类效率方面具备较大优势。