基于双目视觉的立体匹配算法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户：tt1234554321

【摘要】

：

【作者】

：

段子阳

【机构】

：

天津大学

【出处】

：

天津大学

【发表日期】

：

2019年01期

【关键词】

：

立体匹配跨尺度随机游走深度学习卷积神经网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

双目立体视觉是从两个视点观察同一景物,以获取在不同视角下的感知图像,通过三角测量原理计算图像像素点间的视差来获取景物的三维信息。立体视觉技术主要涉及摄像机标定、图像预处理、立体匹配、三维重建等步骤。立体匹配是其中最重要也是最困难的步骤,其主要目的是通过相应的算法获取参考图像与目标图像之间对应匹配点间的关系,生成相应的视差图,依据视差图信息及三角测量原理可得到场景的深度信息。本文介绍双目立体视觉的理论知识和国内外研究现状,从传统方法和深度学习两个方面分别对立体匹配技术进行研究,主要工作如下:1、针对传统跨尺度立体匹配算法缺乏对视差关系的合理约束,不能很好地建模低纹理及重复纹理区域的对应关系问题,本文提出跨尺度随机游走的立体匹配算法,实现匹配代价在多尺度空间及全局域上的有效聚合。Middlebury数据集的实验仿真结果表明,相较于传统的跨尺度立体匹配算法,本文算法能够有效将场景图像在所有区域及非遮挡区域的加权平均误匹配率分别降低1个百分点和3个百分点,获得高精度的视差图。2、针对PSMNet网络参数数量过多和计算耗时过长问题,本文提出基于DenseNet的立体匹配算法,算法通过特征重用和旁路设置的方式以实现网络结构的有效压缩,从而降低网络参数数量及提升算法的时效性。同时针对当前基于CNN的立体匹配算法不能很好地利用上下文信息的问题,本文采用ASPP模块提取图像不同尺度的特征信息,增大感受野,使预测视差图具有更丰富的细节信息。Scene Flow和KITTI 2015数据集的实验仿真结果表明,本文算法在运行速度上比PSMNet提升14.92%。

其他文献

基于双目视觉的三维投影标示技术研究

随着产品质量和生产效率的不断提高,制造业对生产加工过程中的检测技术提出了新的要求。大型船舶制造装配过程中,针对管路对接易出现偏差的问题,现有的检测技术通常采用由操作人员在被测工件表面进行人工检测并划线标记的方法,测量效率低,无法保证测量精度。本文研究了基于双目视觉的三维投影标示系统,利用双目相机对三维空间中特征点进行定位,再由投影设备将测量结果标示在被测物体表面,实现测量可视化,提高了装配检测过程

学位

双目视觉投影标示区域像素重构标示精度优化可视化测量

结构光超分辨显微部分频谱重建算法研究

结构光显微（SIM）是一种宽场、高效的超分辨成像技术,具有低光毒性、成像速度快、无需特殊荧光标记的特点,在活细胞成像领域有着不可比拟的优势。而许多生命活动转瞬即逝,当前的成像速度会错过很多重要的细胞内部作用机理,提高时间分辨率对于细胞器之间、内部作用机理的观察有着重要作用,重建速率的改善也利于实现细胞实时成像。目前主流SIM系统在硬件性能和系统同步效率上已经充分优化,提升空间有限,而重构算法仍需大

学位

结构光照明超分辨重构算法时间分辨率

基于Kinect的RGB-D SLAM算法研究

SLAM（Simultaneous Localization and Mapping）解决的是机器设备在未知环境中如何感知环境的问题,Kinect相机因其可以直接获取深度信息,节省宝贵的计算资源,在视觉SLAM中应用广泛。本文主要从以下四方面对基于Kinect相机的视觉SLAM算法进行研究:首先,对Kinect相机的成像模型进行分析,完成Kinect相机的彩色摄像头与深度摄像头的标定实验,确保图像

学位

KinectSLAMORB定位精度

量子图像传感器噪声消除和图像重建研究

量子图像传感器（Quanta Image Sensor,QIS）是一种具有空间过采样、时间过采样和单光子计数特点的新型图像传感器,它的提出是用来突破由于极小像素尺寸和较低电源电压所导致的CMOS图像传感器信噪比和动态范围降低等瓶颈。量子图像传感器具有极为广阔的应用前景,例如低光成像、高动态范围成像、高速摄像以及高分辨率成像等。目前,量子图像传感器的研究中依然有很多问题亟待解决,比如二进制数据的高速

学位

量子图像传感器图像重建读出架构噪声消除

基于信息通道的眼动行为分析 ——以梵高绘画观察实验为例

近年来,眼动追踪技术逐步发展并被应用于多个领域。在学术和工业研究中,对眼动数据定量化比较的要求越来越高。相比注视点数目,注视时间,扫视幅度,眨眼次数,瞳孔尺寸等传统的眼动数据定量化指标,基于信息论中香农熵和条件熵生成的平稳熵和转移熵在度量眼动特征时表现出优势,并受到越来越多研究者关注。平稳熵反映了注视复杂度,转移熵反映了扫视复杂度,但是这两个指标仅能反映整个观察区域内注视点分布特征和视线转换特征,

学位

眼动信息通道熵互信息梵高绘画

面向气液固三相流检测的快速电/磁层析成像系统设设计

气液固三相流化床在石油、化工、制药、环保等领域中应用广泛,准确地提取相含率、流速等流动参数,对于安全、高效生产具有重要意义。由于多相流流动特性复杂,现有检测方法实时性难以满足气液固三相流检测要求。电学层析成像具有非侵入、无辐射、响应速度快和可视化等优点,在气液固三相流参数检测中具有明显优势;融合两个或多个模态的电学成像方法有望解决气液固三相各相含率分布的在线检测问题。本文针对气液固三相流参数检测的

学位

气液固三相流现场可编程门阵列电容层析成像电磁层析成像数字相敏解调磁导率嵌入式系统

基于全景图的相机位姿估计

现如今,球形全景图已经成为场景记录和可视化显示的一种常用数据形式。全景球形图像呈现的是在空间的单个点捕获的360度场景,可以通过全向相机拍摄或通过拼接多张平面透视图像合成来产生。另一方面,面向平面透视图像的运动恢复结构（Structure-from-Motion）的技术越来越成熟,此技术是利用多张包含视觉运动信息的二维透视图像估计拍摄场景的三维结构。然而由于球形全景图的几何特性,现有运动恢复结构的

学位

相机位姿球面全景图像运动恢复结构三维结构

基于多尺度特征融合的甲状腺结节分类研究

目前甲状腺癌症发病率逐年上涨,居于世界女性癌症发病第四位。早期发现甲状腺癌症如果进行手术治疗,患者的5年存活率高达96%。因此,早期发现和诊断是控制病症的关键。超声成像技术具有无创性、无辐射、低成本和实时成像等优点,是早期检测和诊断甲状腺癌最常用的成像方式。然而,使用超声精准的诊断甲状腺结节需要放射科医生具有大量的临床实践经验。目前,随着深度学习的快速发展,应用深度学习技术处理医学图像问题已成为一

学位

卷积神经网络甲状腺结节分类多尺度特征数据集构建

自主目标搜索无人机视觉系统技术研究

旋翼型无人机因其成本低、易维护、可扩展性强的特点,受到了广泛的使用。目前在大部分应用场景下都需要人工对无人机进行操作,因此有必要让无人机具有自主执行一些任务的能力,以降低其使用门槛并节省人力。无人机在自主执行任务的过程中,很多导航过程与任务的执行可以依靠视觉来自主完成。因此本文围绕一种可自主进行目标搜索、返航与精准降落的四旋翼无人机,进行了以下主要工作:首先,本文完成了帮助无人机实现上述功能的视觉

学位

无人机目标检测增量学习视觉基准标记自主降落

多光谱透射图像分析与异质体检测

透射多光谱成像具有医学应用的潜在价值,例如乳腺肿瘤的早期筛查。但是生物组织的强散射性和强吸收性致使获得的图像信噪比低且模糊。采用帧累加技术与函数信号调制解调技术可以提升获得图像的灰阶和信噪比,进而提高异质体检出的可能性。使用帧累加结合函数信号调制解调技术获取图像数据需要进行大量计算,并且多光谱透射图像边界模糊,难以进行异质体检测。本文针对上述多光谱透射成像中的图像解调速度问题和图像中异质体的检测问

学位

透射多光谱成像异质体检测快速解调算法异质体粗轮廓提取光谱分析深度学习

基于双目视觉的立体匹配算法研究

其他学术论文