RGBD环境下的场景流估计方法研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:shlpsfs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
3D场景流(Scene Flow)是用于描述空间物体运动3D矢量场,在虚拟现实,目标检测、跟踪及场景理解方面有着广泛应用。随着深度传感器的普及,RGBD场景流在计算机视觉领域引起了越来越多的关注。在RGBD视频流中进行场景流估计时,传统的基于分割的方法对遮挡和大位移具有较好的效果,分层场景流方法能够根据已知场景的相对深度排序对边界建模解决遮挡问题。这类方法的遮挡和场景流估计效果会受到分割结果的影响,且现有的深度层次排序过程自动化程度低。此外,现有基于分割的方法大部分是在分割区域刚性运动的假设下进行场景流估计的,这就会使得非刚体目标的场景流估计不准确。针对以上问题,围绕3D场景流技术,本文分别针对深度图像分层技术,含有非刚性运动的场景流估计以及基于卷积神经网络的场景流估计关键技术进行了研究,本文的主要研究工作包括:(1)提出基于深度图像自动分层的场景流估计算法。该方法首先使用深度图像修复算法修复含有噪声的深度图像,接着使用SLIC超像素分割与相似区域合并算法对深度图像进行初始分层;然后在初始分层中引入光流约束实现深度图像的自动分层,最后分别在数据集Middlebury 2003,SRSF,Princeton Tracking Benchmark 上进行仿真实验,并根据视觉对比与定量分析验证该方法计算分层场景流的可行性与精确性。(2)提出基于局部刚性运动假设的场景流估计算法。该方法首先使用AR(Autoregressive Model)模型计算深度图像分层结果中层辅助函数的权重;接着使用局部刚性全局非刚性假设方法将深度图像分层结果中的每一层分成许多大小相同的块,通过计算每一块的运动信息来估计每一层的运动信息以至于整个场景的运动信息;最后分别在数据集Princeton Tracking Benchmark,Deformable 3D reconstruction上进行仿真实验,并根据视觉对比与定量分析验证该方法计算分层场景流的可行性与精确性。(3)实现基于卷积神经网络的场景流估计网络模型。该方法使用编码-解码的卷积神经网络模型估计场景流。使用FlyThings3D为训练数据集在网络模型中进行训练,在网络的训练过程中使用立体图像对作为网络的输入,由光流与视差计算的场景流作为网络的输出,该部分节省了使用专门的网络计算深度信息而花费的时间;Monkaa数据集与Driving数据集为测试集估计场景流并验证该方法的可行性与精确性。
其他文献
基于三维模型的颅骨相似度评价方法,可以用来检测不同颅骨之间的相似程度,进而为推测面貌的相似度提供参考、为颅骨性别鉴定提供可靠依据,从而辅助提高颅面复原的效果以及基
为让患者在经过基本诊断之后以及在手术前对自身疾病有清晰的认知,消除由于医患信息不对称产生的顾虑,正确了解疾病,论文结合虚拟现实交互式、可视化、沉浸感的优势设计实现
准确评估学生表现,并基于评价数据做出有效教学决策是教师工作最重要的内容之一。《普通高中英语课程标准》(2017)中也进一步明确了评价的促学作用,指出“教师需要处理好教、
声学层析成像温度场重建技术利用围绕被测区域布置的多个声波收发器,形成若干条有效穿越被测区域的声波路径。通过测量声波在各路径上的飞行时间,获取相应方向上的声速分布的
中国卤虫(Artemia sinica)是一类生活在高盐水体中的小型甲壳动物,也是重要的饵料生物,具有极强抗逆能力,也是分子生物学和发育生物学研究的重要实验动物,在胚胎学和分子生物学
肺癌一直是威胁人类健康最常见的恶性肿瘤,具有较高的发病率,它的发病原因和治疗方法一直是人们关注的热点,而基于细胞层面的实验是研究肺癌的方式之一。在研究药物与细胞相
目前,激光已成为现代光学的重要工具应用到科研、工业及军事领域中。传统上的应用多采用激光的基模模式,随着科技的发展,激光高阶模式由于具有特殊的空间结构和正交特性,在一
在触摸屏COG(chip on glass)和FOG(film on glass)热压合制作过程中,FPC(Flexible Printed Circuit)和芯片IC通过ACF(Anisotropic Conductive Film,各向异性导电膜)与玻璃基
社会治理大背景下,政府购买社会服务作为政府职能转移的重要举措日益受到重视。与此同时,为确保社会服务项目能达到目标并有效解决社会问题,社会服务项目评估应运而生。社会
“课堂空间”布置是指教师通过对物质空间、精神空间、社会空间有目的的进行改变和影响,从而来提高课堂效率的一种策略。在掌握课堂空间的维度及要素的前提下,有目的地、有针