【摘 要】
:
从图像中推断三维场景是计算机视觉的核心问题之一,而估计场景的深度信息是解析场景三维几何关系的重要方法。传统方法主要是基于光学几何约束或一些环境假设,比如光照变化、纹理特征和运动中恢复结构等,这些基于一定先验信息的方法日趋成熟。由于深度学习能够提供相对准确的先验信息,所以使用深度学习从图像中预测深度信息也成为计算机视觉领域的研究热点之一。该课题的关键在于如何使用深度学习的方法,从单幅或者多幅图像中获
论文部分内容阅读
从图像中推断三维场景是计算机视觉的核心问题之一,而估计场景的深度信息是解析场景三维几何关系的重要方法。传统方法主要是基于光学几何约束或一些环境假设,比如光照变化、纹理特征和运动中恢复结构等,这些基于一定先验信息的方法日趋成熟。由于深度学习能够提供相对准确的先验信息,所以使用深度学习从图像中预测深度信息也成为计算机视觉领域的研究热点之一。该课题的关键在于如何使用深度学习的方法,从单幅或者多幅图像中获取不同深度的特征表示,并能通过一定的手段展示出来。本文的思路受三维重建方法的启发,以三维重建的方式重建场景深度,使用立体匹配的思想构建深度学习的训练流程,借鉴已有研究经验设计损失函数。具体来说,提出了一种采用深度卷积神经网络进行单图像深度估计的模型,实现了端到端的单幅图像深度估计。该模型通过在编解码结构中引入残差结构、密集连接结构和跳跃连接等方式提升了深度卷积网络在深度估计任务上的性能,改善了网络的学习效率和性能,加快了网络的收敛速度。其次,本文通过结合灰度相似性、视差平滑和左右视差匹配等损失度量设计了一种更有效的损失函数,有效降低了图像光照因素影响,遏制了图像深度的不连续性并能保证左右视差的一致性,从而提高深度估计的鲁棒性。再者,本文为该模型设计了一种独特的训练流程,采用了自监督的监督策略,使用立体图像对作为训练数据,同时也作为训练的监督信号,无需大量带有标签的真实深度数据,节约了训练成本,提升了训练质量。最后,本文通过在网络结构,监督策略,损失函数上的大量对比实验优化模型的各个结构,进一步完善了该单目图像深度估计的框架。总的来说,本文提出了一套行之有效的单目深度估计方法,包括了模型架构,训练方式以及测试流程,完成了从二维图像中估计场景深度的任务,对单目图像深度估计中存在的问题和未来的发展趋势做出了分析与讨论。该方法在KITTI、Cityscapes以及Eigen数据集上都进行了测试,验证了本文提出的深度估计方法的有效性和优越性。
其他文献
伴随着微纳米技术、微机电系统和仿生器械的快速发展,对于结构及其构件的变形和粘附的研究已经引起了科学家和工程师的广泛关注。当物体的尺寸减小到微纳米尺度时,其表面积与
美洲南瓜(Cucurbita pepo L.)属于葫芦科(Cucurbitaceae)南瓜属(Cucurbita)一年生蔓性草本植物,在世界上栽培范极广,深受消费者喜爱。南瓜果实形状和大小直接影响其商品价值,是优良南瓜品种选育的重要目标之一。本试验以两个美洲南瓜纯合自交系‘X10’和‘JIN234’为亲本构建F_2分离群体并绘制遗传连锁图谱,并对南瓜果实长度、果实宽度和果形指数等三个果实形状相关性
分布式多跳协作网络是一种结构灵活、易架设、高抗毁、低成本的新型网络,被广泛用于物联网、军用通信、抢险等场景。其中,MAC(Media Access Control)层主要负责资源调度和网络维护,保障控制信令和数据的正常传输。目前,对于分布式多跳协作网络MAC层的研究停留在协议架构设计以及机制的理论模型分析上,难以满足工程实践的需要。在实际应用中,从提升网络性能方面考虑,现有MAC层机制仍有许多不足
疏花水柏枝(Myricaria laxiflora)因三峡工程修建失去了其在三峡库区的全部生境地而成为了濒危物种,现仅在三峡大坝和向家坝下游长江干流的河滩地有少量的种群幸存。目前残存
煤层上覆岩层动态破坏规律对矿井的合理规划和安全生产起着重要的作用。本文在大量收集现场资料及广泛开展调研的基础上,以塔山煤矿特厚煤层8012工作面为研究对象,运用现场实测数据、理论分析和数值模拟相结合的方法,从工作面围岩应力、覆岩“三带”运动规律和工作面覆岩破断机制三个方面进行理论研究,分析了特厚煤层综放开采工作面覆岩运动规律;采用FLAC3D数值模拟软件,以塔山煤矿8102特厚煤层综放开采工作面为
蛋白激酶在生物体内诸多重要的生理活动过程中扮演了重要的调控角色,例如细胞的增殖、分化、代谢、衰老以及死亡等,它也是新药研发尤其是抗肿瘤药物研发的重要靶点。通过专一的抑制剂和蛋白激酶结合从而调控蛋白激酶活性有益于诸如癌症等重大疾病的治疗。目前以蛋白激酶为靶点开发高效的选择性抑制剂药物成为新药研究的热点。激酶抑制剂根据它们与激酶作用的方式分为可逆抑制剂和不可逆抑制剂,其中不可逆抑制剂是一种共价结合抑制
视紫红质通道蛋白2(Channelrhodopsin-2,Ch R2)是一种光激活的非选择性阳离子通道蛋白,它们可以利用光对神经元的活动进行精确调控。虽然Ch R2作为光遗传学工具已经在神经科
随着我国煤炭资源需求的增加,建(构)筑物下、铁路下、水体下及承压水上(“三下一上”)压煤资源的开采已成为我国煤炭资源的有效补充。水体下多工作面开采由于涉及到重复采动及地表不同的农作物赔偿问题较一般开采复杂,本文以金源煤矿微山湖下23 下05、23 上07、23 下09及23 下07相邻多工作面开采为研究对象,采用理论分析、相似材料模拟、数值模拟及现场实测等研究手段,分析相邻多工作面重复采动覆岩变形
目前,水体污染问题越来越严重,染料工业废水和油品海运漏油是比较典型的两类污染源,处理染料废水和含油污水的方法多种多样,其中比较经济有效的还是吸附回收。本文针对以上两
我国每年由交通事故、生产安全事故以及骨类疾病等造成的骨缺损患者日益增多,因此,人类对于骨组织替换材料的需求日益增加。碳/碳复合材料(C/C)继承了碳单质材料固有的优异生