基于学习的单目稠密语义三维重建

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:conanyuexin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于图像的三维重建是一种从图像中获取三维信息并重新构建场景模型的研究,一直以来都是计算机视觉方向的一个重要研究类别。随着计算机视觉研究的深入和硬件设备性能的提升,三维模型在测绘、教育、医学、影视和娱乐等方面发挥出越来越重要的作用。不仅如此,场景的语义重建在增强现实、无人驾驶等领域的研究价值也日益突显。目前基于Marr的视觉理论框架,形成了诸多基于不同机制、不同设备、不同假设的三维重建方法。其中单目摄像头成本便宜,使用灵活,在实际生活中应用广泛,因此研究单目视觉三维重建技术更具有应用价值。传统的基于图像的的重建算法在缺乏纹理,几何条件复杂,结构单调等情况下都难以发挥很好的作用。当前,深度学习快速发展,将基于深度学习的方法应用于三维重建逐渐变为可能。另外,深度学习在语义分割方面的也取得了长足的发展,将语义信息融合到三维模型上形成语义三维模型也成为重要的研究方向。本文重点开展了特征点提取、图像深度稠密估计以及结合深度图的图像语义分割三个方面的研究:1.特征点提取是基于特征点的三维重建系统的基础。特征点的稠密度、准确度影响了运动结构恢复的准确性。本文研究了基于深度学习的自监督特征点提取算法,采用端到端的方式同时获得特征点位置和描述子,在保证产生足够数量特征点用来进行位姿估计和优化的同时,也兼顾了特征点的可重复性、稳定性和提取速度。2.为解决传统单目图像深度估计强依赖于特征点稀疏程度,纯深度学习估计算法数据需求大、解释性差且精度不高的问题,本文研究了融合几何信息的稠密深度估计算法。模型改进了成本体构造方法和成本体正则化网络,在占用更少硬件资源的同时获得了更精细的深度估计。这样就可以利用得到的深度图进行基于深度融合方法的场景稠密三维重建。3.为了提高深度神经网络语义分割的精度,本文研究了主流的几种语义分割深度神经网络的设计思路和具体方法,在DeepLab v3+网络结构的基础上,添加了一个深度图网络分支,通过RGB网络和深度图网络的多级信息融合以及多尺度信息融合获得更精确的语义分割结果。最后,本文在上述主要研究内容结果的基础上搭建了语义三维重建实验平台。使用开源数据集在平台上进行实验,研究这个实验平台的有效性和性能。另外,本文使用自行拍摄的五种场景下的图像在实验平台上进行语义三维重建,证明了实验平台在实际场景中的可用性。
其他文献
研究了添加微量元素(Ti、V、Zr、Nb)低合金高强度钢焊接热影响区(HAZ)晶内针状铁素体(IGF)的形成机理,并采用TEM和EDS观察和分析HAZ中晶内针状铁素体形成核心的化学成分和结
我国城镇化发展已进入后半程,但以往粗放式的城镇化发展忽视了"人的城镇化",带来了区域发展不平衡和城镇规模结构体系不合理的问题,为了解决城镇化建设遗留问题,国家明确提出
风能作为一种清洁的可再生能源,能够解决当前社会发展过程中带来的许多能源、环境问题,逐渐受到越来越多的关注。但风能具有随机性和间歇性的特点,并入电网会造成不利影响,因此进行风电功率预测增强系统的安全性和稳定性。对于复杂地形条件下的风电场,风速预测一直是研究中的难点内容,是风功率预测的基础,具有重要意义。本文对复杂地形条件下某风电场的短期风速预测方法进行了深入的研究,主要内容如下:首先,根据风电场测风
研究目的:1984年洛杉矶奥运会是奥林匹克史上里程碑式的、对奥林匹克运动影响极为深远的一届奥运会。LA84 foundation是1984年洛杉矶奥运会的宝贵遗产,是1984年洛杉矶奥运会
档案是历史上人类从事实践活动的产物,档案的内容、形式是与其形成的历史条件密切联系的,具体体现为什么时期产生什么样的档案。因此,要分析档案的价值,必须把它放在形成的历史条
将冷轧带钢表面缺陷图像中的所有像素作为高维空间中的特征向量,利用有监督非线性降维方法对其进行减维后再进行缺陷的分类.该方法解决了冷轧带钢表面缺陷自动分类中的特征提
利用透射电镜研究了珠钢CSP工艺试生产的汽车用高强度热轧板中的析出颗粒形貌与分布;利用AshbyOrowan的弥散强化模型讨论了析出物颗粒尺寸及体积分数与屈服强度的关系.结果表
认识并且会书写汉字是学好语文的基础。识字教学乃小学语文教学的重要组成部分,也是提高小学生阅读能力、表达能力的关键所在。本文笔者主要从阅读和识字的关系着手,探讨小学