基于卷积网络的双目视觉立体匹配技术研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:zyh20070901
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双目视觉技术在计算机视觉领域中仍然属于较火热的研究课题,其在三维重建、机器人实时导航以及自动驾驶中有着广泛的应用。立体匹配在双目视觉中具有举足轻重的地位,其匹配结果的精度将直接影响最终视差图的精度,因此提高双目视觉中立体匹配的精度对促进双目视觉技术的发展有着重要意义。本文主要研究了如何将卷积网络应用在立体匹配中,并改进了网络结构和后处理方法,提高了算法性能,本文主要工作分为以下方面:
  (1)对双目技术的海内外研究情况,常用数据集以及立体匹配常用算法进行介绍。同时本文在输入图像块裁剪、视差标签设置以及卷积网络生成视差代价等过程给出详细解释和推导。
  (2)针对其他论文中使用单一尺寸卷积核进行特征提取的情况,本文提出了一种卷积核金字塔特征提取方法,首先使用较小尺寸的卷积核计算图像特征,获得局部图像细节信息,随后使用大尺寸卷积核对提取到的图像特征进行汇总。该方法能够在同级别输入图像块尺寸以及相同网络层结构下获得更高的匹配精确度。
  (3)对于其他论文当中单纯通过扩大输入图像块尺寸来获得更高匹配正确率的方法,本文提出使用反卷积对输入图像块进行参数化调节,设计了基于反卷积的卷积网络立体匹配模型ADSMNet(Adaptive Deconvolution-based disparity matching Net),并与本文提出的卷积核金字塔特征提取方法相结合,该方法能够充分利用图像信息,在较小的输入感受野下达到较小的匹配错误率。
  (4)本文重新设计了卷积网络立体匹配的后处理过程,采用4路径代价聚合方法对卷积网络输出的代价矩阵进行代价聚合,利用聚合后的代价矩阵及二次插值法初步拟合视差图,同时将视差像素精确到亚像素级,设计了内部型左右一致性检测法对初步拟合好的视差图进行左右同名点像素检测,降低了整个后处理算法的复杂度。同时设计了树结构射线填充法,充分利用无效视差点周围的有效视差像素点,对上一步视差图中无效视差像素点进行填充。由实验结果看出,本文设计的卷积网络立体匹配算法能够在较短的时间内获得较高准确度的视差图。
其他文献
计算机辅助诊断(Computer Aided Diagnosis,CAD)研究是一个快速增长的活跃领域,利用CAD技术对人体部位的CT影像进行处理,可以为医生提供实用的参考信息,辅助医生对疾病做出准确的诊断,有效减少漏诊、误诊的情况发生。本文开展基于CT影像肺结节良恶性多种病理类型的云端人工智能辅助诊断系统开发研究,旨在设计一套集CT显示、肺结节提取、肺结节分类诊断等功能的计算机辅助诊断系统,辅助
明确肺结节的良恶性病理类型,对制定精准有效的诊疗方案至关重要。基于深度学习的辅助诊断方法可以减少对医生个体经验和工作状态的依赖,提升诊断效率。然而,现有的公开数据集中鲜有经病理学确认的肺部CT影像数据,无法保证样本标注的准确性和可信度。为更好满足临床需求,依据本课题组从合作医院、研究所采集的经金标准确认的肺部CT影像数据,开展了基于3D多分辨注意力胶囊网络的肺结节良恶性多种病理类型辅助诊断方法研究
医学图像配准是临床医学研究中处理医学图像信息的关键技术,传统方法主要依赖于医生人工标识的特殊标记物作为关键点来指导图像配准,但是该过程复杂而冗长,较为依赖医生经验,容易出现错误。随着数字图像的不断发展,传统方法已经无法应对越来越多的高精度医学图像。因此,使用深度学习(Deep Learning,DL)网络进行医学图像配准逐渐成为研究热点,其中针对高精度数字图像的配准方法研究主要使用端到端的配准方法
多站无源定位技术因其隐蔽性好、作用距离远和成本低等优点在军事领域和民用领域都具有十分广泛的应用。特别是在电子对抗领域,无源定位不主动对外发射电磁波,而是利用目标发射或反射的电磁波,实现对敌方无人机(UAV)、雷达等设施的静默定位,在现代化战争中发挥着愈发重要的作用。目前,无源定位中常用的定位参数有:到达角(AOA)、到达时间差(TDOA)、到达频率差(FDOA)和接收信号强度(RSS)等。本文从几
技术总是在变革中发展,移动通信系统在过去的几十年里迅速地由第一代移动通信技术(1G)发展到已经展开大规模商业部署的第五代移动通信技术(5G),再到目前许多国家都在启动的第六代移动通信技术(6G)研究,移动通信技术已成为世界各国开展科技竞争的制高点。技术发展规律决定了每一代通信技术的标准都需要较长的时间才能够走向成熟,5G虽然已经开始商用,但从非独立组网到全面独立组网的持续演进仍需要时间,针对高带宽
学位
医学图像配准作为医学图像分析的重要工具,其广泛地应用于疾病辅助诊断、人脑图谱以及图像引导放疗等领域。相对于传统3DCT(3-Dimension Computed Tomography,3D CT),肺部4DCT加入了时间轴,其可以为个体提供整个呼吸过程中的全部信息。通过对肺部4DCT图像进行配准,能够有效地刻画肺部组织结构的相对运动,有助于解决在精准放疗、病灶肿瘤跟踪以及肺功能评估等一系列临床应用
百年来,车辆带来诸多便利的同时,因为疲劳驾驶或人工操作失误人工操作失误而造成的交通事故不计其数,产生了巨大社会伤痛和巨额经济损失,人们憧憬着无人自主驾驶车辆带来社会生活进步。同时,作为汽车产业和人工智能发展必然趋势,无人自主驾驶不仅能为汽车产业带来巨大市场利益,而且是人工智能一定要征服的高峰。近年来,越来越多无人驾驶出租车、摆渡车、移动零售车出现在城市道路,公园广场等常见生活场景。  车道线作为道
学位
基于图像的人体行为识别是将计算机视觉和人工智能相结合实现人体行为识别的一种智能化技术,其已广泛应用于特殊人群监护、人机交互等领域,并已成为人工智能的研究热点之一。  目前,基于图像的人体行为识别技术的研究主要基于单分类器,通过优化特征信息、改进识别算法来实现。其虽然取得了很多研究进展,但在模型的通用性和准确率的提升方面仍存在研究瓶颈。单个分类器通常只针对训练好的几种行为的识别效果好,行为种类变化后
学位
近年来,随着可穿戴设备的增多以及互联网技术的发展,人与人之间的信息交互方式发生了巨大改变,由于图像、视频等多媒体数据具有更加形象生动的特征,所以可以更好地满足广大智能媒体用户的需求。然而,随着多媒体数据的爆发式增长,导致了一系列信息检索与空间存储问题。  视频摘要技术利用计算机自动地从原始长视频中提取关键的图像帧或视频片段作为重点摘要内容,使得摘要后的视频总时长缩短,同时还能够将用户认为的重要内容
学位
工业技术在国家综合生产能力体系中占有举足轻重的地位,工业和制造业的发展是一个国家经济实力的重要体现。近年来,随着我国工业化进程的加快和中国“智能制造2025”的推进,工业互联网成为重要的网络基础设施,众多新型工业计算密集型应用也开始涌现,如工业目标检测(Object Detection),人脸识别(Face Recognition),多媒体(Multimedia)传输等等。同时,伴随移动互联网和无
学位