论文部分内容阅读
动态场景下,动态参与者会打破传统VSLAM(Visual Simultaneous Localization And Mapping)算法的静态假设,常见的作法是把动态参与者剔除,只将静态参与者作为相机位姿估计的参照物。当场景中动态参与者占比过高,若粗暴地剔除场景中具有动态语义标签的参与者时,会使位姿估计的参考特征点数量急剧减少,系统的鲁棒性和位姿估计的精度也会大大较低。为了更好地解决场景动态程度对系统鲁棒性的影响,本文提出了一个自适应补偿的视觉里程计(Visual Odometry,VO)系统。本文的主要研究内容和创新点可归纳如下:1)通过对VSLAM的结构框架和研究现状进行总结分析,并对三维空间坐标系变换、相机标定和深度信息配准原理进行了理论推导,本文构造了自适应补偿的稀疏静态特征地图构建模型,它使补偿过程独立线程并具有较大的灵活性,使系统可以更好地适应动态场景。2)通过对动态场景下的特征点预处理过程的深入分析研究以及Mask R-CNN语义分割效果的实验验证,本文提出了分层提取融合框架,实现了从全局到局部的等概率特征点均匀化采样,融合了场景映射多级权重和自组织的时空优先级信息,通过对不同层级的分层提取融合框架的实验分析表明:分层提取融合框架在提高ORB特征点匹配精度和增强系统在不同动态程度场景下的泛化能力上都发挥了重要的作用。3)通过对运动目标检测算法的深入研究以及运动补偿原理的理论分析,结合系统结构需要,本文提出了基于运动补偿的候补像素检测提取算法,在基于Mask R-CNN网络语义分割的前提下,利用运动补偿和恒速运动模型恢复出前一帧场景中的动态参与者像素,并根据重合阈值检测提取候补像素,大大提升了运动检测的精度和鲁棒性。通过对不同重合阈值的实验分析表明:本文系统的重合阈值设置具有较弱的有效区间,也即对人工设置值的变化不敏感,表明该算法和系统结合的合理性。4)通过对目标像素运动补偿效果的实验分析以及图像掩码修正的深入研究。为了进一步优化运动补偿过后的离散像素,提升候补像素检测提取的精度,针对离散像素的造型和处理,本文提出了基于骨架发散的目标图像掩码修正算法。首先,借助双边滤波的思想利用伸缩内在量参数提取整体离散像素区域的边缘并光顺处理,接着利用置信度较高的边缘信息和Delaunay三角剖分,提取并优化整体离散像素区域的骨架,并以骨架作为局部优化的中心向边缘依次梯度优化,借助边缘引导实现区域合并,在像素区域合并过程利用逼近理想解的排序法(Technique for Order Preference by Similarity to an Ideal Solution,TOPSIS)进行理想合并策略排序并利用点云正则化验证。在正则化验证阶段,借助增量和层次结构聚类,迭代简化,使点云抽样集中在高曲率区域并建立表面形变模型,利用边缘缝合误差的大小来筛选最优的缝合策略。通过对单目标、多目标像素区域实验,以及通过同一序列不同算法和不同序列同一算法的实验论证对比也表明:本文算法能克服离散像素区域过分的收缩和膨胀,实验效果优于现存的其它算法。本文系统的整体实验在TUM RGBD数据集[79]上进行,和现有的很多优秀的视觉里程计算法比起来,在大多数不同动态程度的场景中,相机运动的绝对轨迹误差和相对轨迹误差都得到了明显减小,本文算法在动态场景下体现了更健壮的鲁棒性和更高的精度。