动态场景下自适应补偿的视觉里程计关键技术研究

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户：qqQQ106942397

【摘要】

：

动态场景下,动态参与者会打破传统VSLAM(Visual Simultaneous Localization And Mapping)算法的静态假设,常见的作法是把动态参与者剔除,只将静态参与者作为相机位姿估计的参

【作者】

：

许正恒

【出处】

：

浙江理工大学

【发表日期】

：

2020年01期

【关键词】

：

动态场景自适应补偿的稀疏静态特征地图分层提取融合框架骨架发散边缘合并二值掩码修正

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

动态场景下,动态参与者会打破传统VSLAM(Visual Simultaneous Localization And Mapping)算法的静态假设,常见的作法是把动态参与者剔除,只将静态参与者作为相机位姿估计的参照物。当场景中动态参与者占比过高,若粗暴地剔除场景中具有动态语义标签的参与者时,会使位姿估计的参考特征点数量急剧减少,系统的鲁棒性和位姿估计的精度也会大大较低。为了更好地解决场景动态程度对系统鲁棒性的影响,本文提出了一个自适应补偿的视觉里程计(Visual Odometry,VO)系统。本文的主要研究内容和创新点可归纳如下:1)通过对VSLAM的结构框架和研究现状进行总结分析,并对三维空间坐标系变换、相机标定和深度信息配准原理进行了理论推导,本文构造了自适应补偿的稀疏静态特征地图构建模型,它使补偿过程独立线程并具有较大的灵活性,使系统可以更好地适应动态场景。2)通过对动态场景下的特征点预处理过程的深入分析研究以及Mask R-CNN语义分割效果的实验验证,本文提出了分层提取融合框架,实现了从全局到局部的等概率特征点均匀化采样,融合了场景映射多级权重和自组织的时空优先级信息,通过对不同层级的分层提取融合框架的实验分析表明:分层提取融合框架在提高ORB特征点匹配精度和增强系统在不同动态程度场景下的泛化能力上都发挥了重要的作用。3)通过对运动目标检测算法的深入研究以及运动补偿原理的理论分析,结合系统结构需要,本文提出了基于运动补偿的候补像素检测提取算法,在基于Mask R-CNN网络语义分割的前提下,利用运动补偿和恒速运动模型恢复出前一帧场景中的动态参与者像素,并根据重合阈值检测提取候补像素,大大提升了运动检测的精度和鲁棒性。通过对不同重合阈值的实验分析表明:本文系统的重合阈值设置具有较弱的有效区间,也即对人工设置值的变化不敏感,表明该算法和系统结合的合理性。4)通过对目标像素运动补偿效果的实验分析以及图像掩码修正的深入研究。为了进一步优化运动补偿过后的离散像素,提升候补像素检测提取的精度,针对离散像素的造型和处理,本文提出了基于骨架发散的目标图像掩码修正算法。首先,借助双边滤波的思想利用伸缩内在量参数提取整体离散像素区域的边缘并光顺处理,接着利用置信度较高的边缘信息和Delaunay三角剖分,提取并优化整体离散像素区域的骨架,并以骨架作为局部优化的中心向边缘依次梯度优化,借助边缘引导实现区域合并,在像素区域合并过程利用逼近理想解的排序法(Technique for Order Preference by Similarity to an Ideal Solution,TOPSIS)进行理想合并策略排序并利用点云正则化验证。在正则化验证阶段,借助增量和层次结构聚类,迭代简化,使点云抽样集中在高曲率区域并建立表面形变模型,利用边缘缝合误差的大小来筛选最优的缝合策略。通过对单目标、多目标像素区域实验,以及通过同一序列不同算法和不同序列同一算法的实验论证对比也表明:本文算法能克服离散像素区域过分的收缩和膨胀,实验效果优于现存的其它算法。本文系统的整体实验在TUM RGBD数据集[79]上进行,和现有的很多优秀的视觉里程计算法比起来,在大多数不同动态程度的场景中,相机运动的绝对轨迹误差和相对轨迹误差都得到了明显减小,本文算法在动态场景下体现了更健壮的鲁棒性和更高的精度。

其他文献

基于神经网络的藏语语言模型研究

现阶段是信息化的时代,也是科技化的时代。随着云计算、大数据、人工智能等诸多领域的快速发展,神经网络语言模型也在跟随时代前进的脚步,在语音识别、光学识别技术、自然语

学位

藏语语言模型神经网络

未成年家暴受害者适用人身安全保护令制度的完善

提及家庭暴力的话题,社会大众的印象一般是以两性婚姻暴力为代表的成年人间的家庭暴力,而对未成年人遭遇家庭暴力的关注却相去甚远,甚至认为是一种教育行为。相比于两性婚姻

学位

家庭暴力未成年人特殊性人身安全保护令

文学出版视野下的开明派

开明派是一个同人聚合较为松散的文学文化文人集合。开明派同人因具有相同的文化志趣和社会理想于20世纪20年代初聚集在一起,主要成员有经亨颐、匡互生、夏丏尊、朱自清、丰

学位

开明派文学出版新文学文教并重

基于深度学习的非完备信息博弈局面信息自动获取系统

自人工智能概念出现至今,人类从未停下对机器博弈探索的脚步。机器博弈依据其对于博弈局面信息了解的程度,可分为完备信息博弈和非完备信息博弈。如围棋,国际象棋这类博弈竞

学位

非完备信息博弈深度学习Mask R-CNN局面信息自动获取系统

结合场景深度估计的场景拓扑结构研究

单目图像场景深度结构研究一直是当前计算机视觉任务中重要的组成部分,该任务关注于如何从单目图像中获取与之相对应的场景深度结构。在Marr奠定的计算机视觉理论中,一直将其

学位

深度估计深度排序隐马尔可夫模型空洞卷积跨层连接

基于OpenMP的可变长解压算法推测并行化方法研究

可变长压缩算法根据Huffman编码原理对数据进行最大化压缩,方便数据进行存储和通信,它的应用领域包括图像和视频处理、音频处理、网络和数据备份等等。尽管可变长压缩算法很

学位

可变长解压算法并行线程级推测数据依赖

面向物联网的实体智能搜索与推荐策略研究

随着物联网的日益成熟,物理世界中实体数量的爆炸增长,物联网搜索技术通过传感器采集并整合物理世界中的实体信息,及时为用户提供所需实体的状态信息。而由于实体的异构性与

学位

物联网搜索搜索算法边缘计算实体识别推荐系统

基于光流外推和神经网络的视频差错掩盖算法研究

目前国际上主流的视频编码标准均采用基于宏块的预测编码与变换编码相结合的混合编码框架。编码标准的核心思想是充分利用视频帧内和帧间的时空相关性,尽可能减少数据冗余。压缩后的码流在传输过程中,对电磁干扰及报文丢失的免疫能力特别薄弱。帧内一个编码单元的错漏会带来差错在当前帧和后续帧中持续蔓延,大大影响终端用户的视频观看体验。视频差错掩盖算法在解码端根据帧内和帧间有用的时空域信息,恢复在传输中受损的宏块和帧

学位

视频传输差错掩盖光流计算卷积神经网络运动补偿

论我国网络游戏直播的著作权保护

网络游戏直播作为一个新兴产业,一直以来并未得到学界的重视。直到2015年的“耀宇诉斗鱼”案的出现,才使得游戏直播这一特殊多媒体传播方式开始引起人们关注,此后开始有学者

学位

游戏直播著作权直播平台合理使用

基于堆外测量使用扰动搜索方法的堆芯功率重构研究

通过对核反应堆功率分布的实时监测,可以更好地保证核电站运行的安全性和经济性。对于第二代压水堆来说,堆内测量系统只能通过部分组件内的定期测量重构堆芯功率分布,无法实

学位

扰动变量特征统计算法堆外探测

动态场景下自适应补偿的视觉里程计关键技术研究

其他学术论文