论文部分内容阅读
随着Kinect、RealSense等新型三维智能传感技术的出现,使得记录高质量的RGB图像和深度(Depth)图像变得十分便捷,而基于RGB-D图像的三维目标识别研究也得到广泛关注。已有研究表明,RGB和深度图像信息的结合可以显著提高三维目标识别的准确率。特征提取是三维目标识别研究的重要部分,而深度学习算法在自主学习和特征抽象方面表现突出,已经成为计算机视觉领域的重要研究方向。因此,本文针对三维目标识别任务,结合RGB图像和深度图像信息,提出基于有监督深度学习和无监督深度学习的RGB-D目标识别算法。首先,本文提出一种基于监督学习策略的多模态深度卷积神经网络(DCNN)改进算法。该改进算法通过采用PCA估计曲面法线来实现对Depth模态图像的彩色化编码,并使用CaffeNet模型[50]作为预训练参数,经过参数微调实现模型训练和特征融合。然后,提出一种基于非监督学习策略的特征学习算法—CNN-SPPL-RNN。该算法针对CNN-RNN模型[41]中对不同尺寸的输入图像的泛化问题,引入空间金字塔池化层(SPPL),并借助SPPL从不同的空间尺度提取平移不变性特征,再通过随机RNN网络层组合成高级特征。最后,在采用本文的CNN-SPPL-RNN算法提取特征的基础上,提出一种树形结构的姿态估计算法框架。本文采用Softmax分类器,在RGB-D数据集上进行算法性能验证,结果表明改进的多模态DCNN算法类别识别准确率小幅提升,实例识别准确率高达96.9%,较HMP算法[38]提升了4.1%;基于非监督深度学习的CNN-SPPL-RNN算法在使用较少特征的情况下,能达到目前最高的类别识别准确率;同时,提出的姿态估计算法能有效地实现姿态定位。