多源多视的三维场景和物体重建

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：oliver777

【摘要】

：

【作者】

：

谢浩哲

【机构】

：

哈尔滨工业大学

【出处】

：

哈尔滨工业大学

【发表日期】

：

2021年01期

【关键词】

：

三维重建三维物体重建场景语义感知多尺度上下文感知几何结构感知

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

赋予机器像人类一样感知三维世界的能力一直是人工智能领域的一个长期研究的问题。受到人类认知方式的启发,本文展开了多源多视的三维场景和物体重建的研究。所提出的方法从大量样本中学习形状先验,因此甚至可以从单视角的彩色或者深度图像推测某个物体完整的三维结构。随着输入视图数量的增多,三维重建结果可以被不断改善。三维重建有许多潜在的应用,例如计算机辅助设计、混合现实、自动驾驶和机器人等。本文在分析了相关研究后发现,现有的三维重建方法主要存在三个问题:第一,这些方法需要扫描完整的物体才可以重建物体完整的三维结构,然而这在一些情况下是不可行的;第二,这些方法难以充分利用不同数据源和视角的数据,仅能从彩色或深度图像中重建三维结构,然而彩色图像的多视角特征匹配在弱纹理或重复纹理物体上会失败,深度图像也无法获取不发生反射物体的几何结构。第三,这些方法不考虑场景的语义信息,因此重建后的物体和背景融为一体,难以将物体从重建的场景中分离。本文针对上述问题,依次从单源单视三维物体重建、多源多视三维物体重建和多源多视三维场景重建三个层面展开研究。具体地,本文的研究内容和主要贡献分为以下三个方面:首先,为了解决现有方法无法恢复物体不可见部分三维结构的问题,本文针对单目彩色相机、双目彩色相机和深度相机从单视角拍摄的图像提出了三种几何结构感知的单源单视三维物体重建方法,利用已知的颜色或空间信息以及学习的几何先验推断物体未知部分的三维结构。对于单目彩色相机,本文提出了基于几何先验的三维物体重建方法,从大规模三维数据集中学习几何先验,隐式地建立图像空间和三维模型空间的映射关系;对于双目彩色相机,本文提出了基于深度感知的三维物体重建方法,利用双目视图估计物体的深度图,在恢复物体完整三维结构时更好地保留物体几何结构的细节;对于深度相机,本文提出了基于网格化残差网络的三维物体重建方法,将3D Grid作为几何结构的中间表示,使得在计算时充分利用上下文信息,同时更好地保留了深度相机所捕获的几何结构。在Shape Net、Pix3D和KITTI等数据集上的实验结果表明,所提出的这三个方法可以从单视角拍摄的图像中恢复某个物体的完整三维结构,其重建质量相比于现有方法有3%至18%不等的提升。其次,为了解决现有方法无法充分利用不同数据源和视角数据的问题,本文提出了多尺度上下文感知融合的多源多视三维物体重建方法,通过在三维模型空间融合多个彩色相机和深度相机的重建结果,使得不同数据源和视角的信息得以相互补充。一方面,不同模态的数据对于不同材质的物体具有不同的鲁棒性:对于弱纹理、重复纹理的物体,多视角彩色图像难以恢复其三维结构;对于不发生反射的物体,深度图像也无法获取其几何信息。另一方面,不同的视角可以观察到物体的不同部件,而往往可见部件的重建结果优于不可见部件的重建结果。利用这两个特性,本文提出了多尺度上下文感知融合,对来自不同数据源和不同视角重建结果中的每个部件的重建质量进行评估,从中选取重建质量最佳的部件生成最终的重建结果。在Shape Net、Pix3D和Things 3D数据集的实验结果表明,所提出的多尺度上下文感知融合不仅在重建质量上相比现有的方法有4%至20%不等的提升,而且拥有更好的可解释性。最后,为了使得场景中的物体可以直接从重建的场景中分离,本文提出了基于场景语义感知的多源多视三维场景重建方法,通过在重建时对场景进行语义建模,实现在重建场景的同时恢复场景中每个物体完整的三维结构。为了实现场景语义感知,本文提出了基于局部特征记忆网络的视频物体分割方法,该方法将场景中的物体从图像序列中分离,并更好地区分具有相似外观的物体。为了重建场景和其中的物体,本文设计了基于场景语义建模的三维场景重建方法,该方法通过重建每个物体的完整三维结构,并估计物体的位置和位姿,从而完成对三维场景的重建。在SUN3D数据集和实地拍摄的视频上的实验结果表明,所提出的基于场景语义感知的多源多视三维场景重建方法对场景和其中的物体能取得比现有方法更好的重建结果。通过上述研究,本文对三维场景和物体重建进行了深入的探索,并为真实场景的三维重建提供了切实可行的解决方案。本文从单源单视单物体三维重建问题出发,进而提出了针对多源多视单物体三维重建和多源多视多物体的三维重建方法。针对现有三维重建方法所存在的三个问题,本文所提出的方法在重建场景时对场景进行语义建模,使得场景中物体的三维结构可以被更完整地恢复和并更容易地分离;同时,该方法对弱纹理、重复纹理和不发生反射的物体更加鲁棒。

其他文献

Si2N2O基陶瓷的水基直写成型工艺与性能研究

Si2N2O陶瓷化学性质稳定,介电和力学性能优异,在航天透波领域极具应用潜力。但Si2N2O固有的硬脆特性使得复杂构型部件的制备效率低下且成本高昂,限制了其进一步发展。直写成型技术（DIW）能够以陶瓷浆料为墨水,高效成型复杂构型的陶瓷坯体,缩短产品设计-制造-测试-应用周期。本文开展了Si2N2O陶瓷的DIW成型工艺及性能研究。包括高性能水基墨水的设计和优化,水基浆料流变特性的演变规律;原料组成对

学位

Si<sub>2</sub>N<sub>2</sub>O陶瓷直写成型技术流变性能β-Si<sub&g

MAPbI3和MAPbBr3钙钛矿晶体的电子束辐照稳定性及分解机理

近年来由于合成价格低廉以及光电转化效率高,基于有机无机杂化钙钛矿（Organic-inorganic hybrid perovskites,OIHPs）材料为光电转换层的太阳能电池得到了飞速发展。然而OIHPs材料结构不稳定,容易分解,进而影响太阳能电池器件的效率和稳定性,极大地阻碍了该技术的商业化发展。研究其分解机理有利于指导器件性能优化。在众多研究手段中,透射电子显微镜（Transmissio

学位

有机无机杂化钙钛矿透射电子显微镜分解机理中间相抑制分解低剂量成像

低环境温度准二级变频空气源热泵供暖性能提升研究

近年来,随着我国“煤改清洁能源”的推进,准二级压缩空气源热泵在华北等寒冷地区得到了快速应用,取得了良好的节能效果,也促进了空气源热泵从采用定频压缩机到变频压缩机的普及,即准二级变频空气源热泵。然而,当准二级变频空气源热泵应用到温度更低的严寒地区时,因环境温度更低和负荷调节变化而遇到低温适应性、结霜区间变化和除霜速度慢等问题,影响其供暖性能。本文以推动准二级变频空气源热泵在严寒地区的应用为主要目标,

学位

空气源热泵准二级压缩性能提升低温适应性结霜图谱补气除霜

纳米材料对顶管法施工触变泥浆减阻性能影响及浓度优选研究

顶管法施工具有设备少、工序简单、工期短、造价低等优点,被广泛应用于城市涵管、管廊等工程中。触变泥浆是顶管施工中重要的润滑减阻剂,其减阻性能的好坏对顶管施工特别是长距离、大断面顶管工程的顺利进行至关重要。论文使用膨润土触变泥浆为基础泥浆,质量配比为膨润土:羧甲基纤维素钠（CMC）:无水Na2CO3:水=80:2:3:920,并选择纳米ZnO、纳米SO2、纳米Al2O3 3种纳米材料作为添加剂,通过测

会议

触变泥浆顶管施工减阻性能纳米材料

Ga2O3纳米棒的制备及紫外探测性能研究

日盲紫外探测技术凭借其环境噪声低、抗干扰能力强、灵敏度高等优势获得了越来越多的关注,并在短波通信、导弹预警、火灾检测、生物医疗、天文天体等多种领域都具备实际的应用价值。Ga2O3作为半导体材料,禁带宽度范围在4.4～5.3e V,对应的响应波段正好位于日盲紫外区域,同时它具有制备手段丰富、稳定性高等多种优势,自然推动其成为了日盲紫外探测领域的热门候选材料。然而Ga2O3也存在一些问题,包括制造高质

学位

氧化镓日盲紫外探测纳米结构异质结水热

碳纳米管调控的镍钴MOF基电极材料及其储能性能研究

日益增长的能源储存需求对电化学储能器件的要求越来越高,合理设计和构筑新型电极材料以提升储能器件的性能已成为当前新能源发展战略下的重要课题,也是推动社会经济可持续发展的重要保障。作为一种极具前景的电化学储能器件,混合超级电容器有机结合了电池和超级电容器各自的储能优势,实现了高能量储存和高功率输出的一体化。电池型电极作为混合超级电容器的重要组成部分,对整个器件的储能性能具有决定性的影响。因此,合理设计

学位

混合超级电容器碳纳米管金属有机框架电池型电极氧化还原反应

基于用户行为序列挖掘的个性化推荐方法研究

推荐系统是数据挖掘和机器学习领域热门的研究方向之一。在互联网技术飞速发展的大数据时代,推荐系统是解决信息过载的重要技术手段。推荐系统的性能取决于推荐模型或算法对于用户个性化的兴趣和需求的理解。如何利用合理的技术手段,从大规模高维稀疏的用户历史行为数据中,挖掘出用户个性化的兴趣与需求,是当下推荐系统领域的重点研究问题。用户历史行为数据天然以序列（会话）的形式累积在推荐系统中。传统的推荐方法大多采用基

学位

推荐系统用户行为序列序列推荐强化学习

小行星自主着陆轨迹规划和控制方法研究

针对小行星着陆任务中的探测器动力学耦合、多约束、非凸性强、不确定性大等特点,考虑到对精确着陆、自主性控制、机载实时计算和鲁棒性的要求,本文对小行星自主着陆轨迹规划和控制方法进行了研究,具体内容包括:分析小行星着陆任务特性,划分着陆小行星过程,给出小行星引力场和探测器动力学的建模,以及保证探测器安全飞行和着陆点跟踪、控制能力受限、飞行开始和结束等约束的数学表达,综合考虑燃料消耗和飞行时间等性能,建立

学位

小行星着陆耦合动力学多约束轨迹规划hp-伪谱法求解序列凸规划求解模型预测控制

多智能体系统自主规避任务决策方法研究

随着航空航天事业的高速发展,越来越多的飞行器采用群体或多体协同的方式执行任务,呈现出典型的多智能体特征,适于使用多智能体理论对其进行分析和建模,对分布式自主决策技术的需求日益突出。飞行器自主规避是确保其安全性最直接有效的方法,但是当前对相关技术的研究多是基于静态全局规划算法,难以满足动态场景中多实体间实时协同需求。为了解决多实体协同规避问题,本文引用多智能体系统思想对其进行规避任务决策技术研究。多

学位

多智能体系统强化学习规避机动神经网络优化信度分配稀疏奖励

集群无人机空基回收任务规划方法研究

依托于技术的进步与发展,无人机越来越多地被用来执行各种军事与民用任务。考虑到任务场景与环境的不断复杂化,采用无人机单机执行任务将会难以满足未来应用需求,因此大规模集群化成为无人机近些年的主要发展趋势。而为了将集群无人机低成本、低战损、高机动性、高灵活性的优势发挥到极致,空基回收技术将会是不可或缺的一环。在未来,利用运载机实现“投放-工作-回收-再投放”的任务执行模式能够大大提高自主集群无人机作战的

学位

集群无人机空基回收回收航迹规划回收任务调度回收任务规划

多源多视的三维场景和物体重建

其他学术论文