基于RGB-D视频序列的大尺度场景三维语义表面重建技术研究

来源 :中国科学院大学(中国科学院上海技术物理研究所) | 被引量 : 6次 | 上传用户:zhuoluo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
场景的三维语义表面重建是通过相机拍摄的视频图像序列来重建场景的三维语义表面信息,其在增强现实、无人驾驶以及室内机器人等领域具有较高的研究价值。随着深度学习的不断发展,将基于深度学习的语义分割应用到场景语义表面重建领域也逐渐成为可能。本文设计了基于RGB-D相机的三维语义表面重建系统,重点开展了相机位姿的实时跟踪和优化、单帧RGB-D图像的语义分割以及场景的三维语义表面重建技术三个方面的研究。主要的创新点和贡献如下:为了保证特征点在图像中均匀分布,本文研究了自适应的ORB特征点提取算法,保证了前后帧图像的重叠区域有足够的特征点来估计相机的位姿。本文设计了有效的关键帧策略,该策略既保证了相机位姿跟踪的鲁棒性,又避免了关键帧的冗余。为了提高系统对于室内环境中相机各种运动情况下的相机位姿跟踪的鲁棒性,本文研究了基于光流跟踪的特征点匹配方法。该方法对于相机快速旋转运动、往返运动的跟踪具有很好的鲁棒性。为了提高卷积神经网络语义分割的精度,首先,本文提出了具有恒等捷径连接的空间金字塔网络模块用于提取图像的多尺度信息,金字塔并行网络的不同尺度通过设置卷积核中“孔”的不同大小来实现,并通过恒等连接结构设计成残差网络模块来加速网络的训练,金字塔模块显著改进了网络语义分割的精度。其次,本文设计了RGB-D特征信息多级融合网络模块用于综合彩色图像的纹理信息和深度图像的结构信息,该网络模块通过多级特征图融合网络,充分综合了彩色图像和深度图像浅层特征和深层特征的信息,进一步提高了语义分割的精度。基于TSDF空间网格模型对大尺度场景进行三维语义表面重建,并根据语义信息的特点,本文研究了三维语义体积元的表示方法、融合方法和语义表面生成方法。为了实现大尺度场景的表面重建,系统不断地将TSDF空间网格模型沿着相机轨迹进行位移。同时,本文还提出了将三维语义投射图与单帧语义分割图进行融合的算法。该算法不但提高了单帧语义分割的精度,而且提高了前后帧图像间语义分割结果的连贯性和稳定性。最后,本文搭建了语义SLAM系统实验平台。研究并设计了软件系统的实时性优化方法,提高了系统整体的实时性。在TUM RGB-D数据集上验证了本文设计的语义SLAM系统对于相机位姿跟踪的鲁棒性。在NYUv2数据集上验证了融合语义图对于单帧图像语义分割结果的改进。在大尺度数据集上验证了系统对较大尺度场景的三维语义表面重建的性能。
其他文献
在传承多年共青团传统的基础上,山东德州百货大楼(集团)有限责任公司团委将团干队伍建设,发挥团组织服务企业中心工作作为努力方向;将青年思想引领,带动团员青年践行社会主义
西双版纳的27种桑寄生科植物,危害着野生和栽培的双子叶植物及裸子植物83科263属183种。受害严重的果园植株受害率达76—96%,老式茶园的普洱茶60%以上植株受害,三叶橡胶树50%以
面对中国经济继续平稳发展,各行业企业的转型升级正在逐步推进,包括我们身处的金属加工行业,其中的机床、工具也面临产能过剩、核心技术急需创新、市场格局正在发生深刻的变
汪曾祺是一位享誉文坛的小说作家、散文家,也是一位在绘画艺术上颇有成就和造诣的水墨画家,他的散文和小说风格简练、清雅、质朴,呈现出民间风俗画的风貌。作为一位文学和绘
创新精神牢牢根植于山特维克可乐满的企业DNA,6月23日在廊坊山特维克可乐满中心举行的2016年新闻发布会上,这一点再次得到了生动的演绎。
资产证券化是20世纪国际金融领域中最重要的一项金融创新,它起源于美国,发展于美国,又在世界范围内得以推广。本文从国内外资产证券化的现状出发,以中集集团(CIMC)为例来详细
深孔加工向来是金福切削加工难点,传统工艺会造成枪钻崩刃、折断问题。通过改进枪钻结构形式——可转位刀片+带导条式高强度刀杆,采用带断屑槽刀片,使得排屑更顺畅,彻底解决折断及
为了提高小型锥面密封副的密封性能,减小表面粗糙度,研制了一种单片机控制的小型锥面密封副研配装置。采用了垂直布局方案,该装置主要由旋转研磨机构、升降机构、定位夹紧机
本文基于证券投资者视角,采用数理统计方法发展起来的期权定价模型,对无法避免主观估计的影响所确定的估价金额,与会计计量中的公允价值在内在要求的差距进行了分析。认为公
<正>恐怖主义是人类的公敌,对国家安全、政治稳定、经济社会发展、民族团结和公民生命安全构成严重威胁。反恐怖主义工作事关改革发展、社会稳定和人民群众的切身利益。2019