论文部分内容阅读
复杂场景中的目标识别是计算机视觉领域中一项基础研究,其在众多领域中均有着重要的应用价值,如智能监控、自动装配、遥感、移动操作、机器人、生物分析和医学治疗。与传统二维图像相比,三维深度图像能提供更多几何信息,并且三维特征不受尺度、旋转和光照度影响。再者,通过三维深度图像能获得目标的六维姿态信息。因而三维深度图像在处理目标识别问题时有潜在优势。此外,近些年来,三维数据获取工具成本的大幅降低以及快速运算设备性能的提高使得三维目标识别算法运算时效大幅提高。以上因素使得三维目标识别在计算机视觉领域体现出其不可替代的价值,并促使其成为当前研究热门。而在实际生活中,由于硬件设备缺陷导致获取的三维深度场景包含噪声、点云密度稀疏、目标自身残缺以及目标互相遮蔽等问题,使得三维目标识别研究仍然为一项十分艰巨的挑战和任务。因此,提高三维特征描述符的描述性能,解决复杂场景中三维目标识别问题迫在眉睫。围绕以上问题,本文通过基于局部特征描述符的方法来对复杂场景中目标识别问题进行分析及研究,主要创新工作如下:1.针对包含旋转、平移、噪声、稀疏、目标自身残缺和目标互相遮蔽等干扰的场景中特征错误匹配问题,从三维目标和场景的空间分布信息和几何特性信息着手进行研究分析,并提出FFIS(Feature Fusion Information Statistics)特征描述符。在构建特征描述符过程中,为了提高特征描述符抵抗旋转和平移等干扰的能力,提出了一种基于特征点局部邻域曲面LSP(Local Surface Patch)的局部参考坐标系LRF(Local Reference Frame)。不同于以往方法,该方法通过将LSP散列矩阵(Scatter Matrix)的特征向量投影到与LSP法向量垂直的平面来构建LRF。基于该LRF,FFIS联合网格分布信息和点分布信息来生成特征描述符,使得特征描述符计算简便且高效。以Recall vs 1-Pre isio 曲线作为算法评价标准来验证算法在复杂场景下的有效性,实验结果表明FFIS方法相对于其他方法(Spin Image,3DSC,FPFH,PFH,USC,RoPS以及SHOT)能在复杂场景中提取出更多正确的特征匹配对,尤其是在无噪声场景中,FFIS达到了95%Recall率。2.针对复杂场景中特征对目标描述能力弱的问题,同时为了提高复杂场景中三维特征匹配正确率,提出了HGND(Histograms of Gaussian Normal Distri-bution)特征描述符。该方法首先通过 LSP 散列矩阵的两个特征向量来构建 LRF,从而获得特征的旋转和平移不变性。HGND特征描述符基于几何和空间信息,该方法通过空间点对应的法向量几何投影分布来生成HGND特征描述符,来保证HGND在复杂场景中的描述性和鲁棒性。通过与Spin Image、3DSC、FPFH、PFH、USC、RoPS以及SHOT等方法对比,验证了HGND方法在不同干扰下对目标的描述能力。同时还验证了HGND方法在复杂场景中能有效提高三维特征匹配的正确率,尤其是在低噪声场景中,HGND达到了90%Recall率。此外,HGND在运算效率上也获得了最优的表现。3.针对包含大量错误特征匹配对、高程度目标自身残缺以及稀疏点云的复杂场景中三维目标识别及其姿态估计问题,提出了基于霍夫空间的假设生成方法HG(Hypothesis Generation)来提取场景中潜在目标假设实例。不同于现有方法,该方法基于霍夫变换和霍夫空间,并采用“self-adapted”自适应微调法来辅助HG生成潜在的目标假设实例。基于该HG方法,随后提出了基于ICP的双步假设验证方法HV(Hypothesis Verification)来验证HG阶段所产生的潜在目标假设实例的正误性,最终通过该HV方法验证的假设实例将被判定为正确的识别结果。实验结果表明,该HG和HV方法能够在包含高FP率、高程度目标自身残缺度以及稀疏点云的场景中正确地识别复杂场景中目标及其六维姿态信息。尤其当FP率低于95%,HG和HV方法在复杂场景中能够达到99.95%识别率。本文提出的方法利用局部特征描述符实现了复杂场景与目标的直接匹配,完成了在复杂场景中三维目标识别及其姿态估计问题,降低了算法复杂度,提高了算法运算效率,达到了较高的目标识别准确率,在计算机视觉领域中拥有良好的应用前景。