【摘 要】
:
在计算机视觉领域,通过单目图像进行三维场景的深度估计一直是一个极具挑战性的问题。单目深度估计的目的是获取3D场景中物体表面位置与相机平面之间的垂直距离信息,该技术广泛应用于三维重建、场景感知、增强现实等领域。随着计算机数字图像处理技术和深度学习技术的快速发展,单目深度估计算法主要可以分为基于传统的机器学习方法、有监督深度学习方法和无监督深度学习方法。近年来,针对计算机视觉单目深度估计研究领域,深度
论文部分内容阅读
在计算机视觉领域,通过单目图像进行三维场景的深度估计一直是一个极具挑战性的问题。单目深度估计的目的是获取3D场景中物体表面位置与相机平面之间的垂直距离信息,该技术广泛应用于三维重建、场景感知、增强现实等领域。随着计算机数字图像处理技术和深度学习技术的快速发展,单目深度估计算法主要可以分为基于传统的机器学习方法、有监督深度学习方法和无监督深度学习方法。近年来,针对计算机视觉单目深度估计研究领域,深度学习方法取得了显著成果,然而为特定任务通过人工不断验证和优化网络模型参数的方法,需要花费大量的时间和精力,这对人工设计网络模型的技术提出了更高的要求,需要设计人员掌握丰富的深度估计相关的网络模型设计经验。面对日益复杂的网络模型结构,依靠人工设计网络模型变得越来越困难。基于此,本文通过研究神经网络架构搜索技术(Neural Architecture Search,NAS),实现自动构建并优化单目深度估计网络模型。基于神经网络架构搜索方法自动构建网络模型主要可以分为三个步骤:首先是设计网络架构搜索空间;其次是根据相应的搜索空间确定搜索网络模型的搜索策略;最后是对搜索到的网络模型进行性能评估,迭代循环直至搜索到最优的网络模型为止。网络架构搜索策略可以在预设的网络模型搜索空间中不断对网络模型进行迭代优化更新。性能评估策略用于对搜索到的网络模型进行定量的性能评估,通常使用连续可微的损失函数,以便通过反向梯度传播法对搜索策略进行优化。本文研究方向为基于神经网络架构搜索技术的单目图像深度估计,研究内容主要包括以下三个方面:(1)本文研究了基于人工设计的单目深度估计网络模型算法,以及近年来常用的神经网络架构搜索技术,并从搜索空间、搜索策略和性能评估三个方面分析了现有的典型神经网络架构搜索方法的优缺点,为下一步将神经网络架构搜索技术应用于单目深度估计奠定了理论基础。(2)本文提出了一种基于神经网络架构搜索的单目深度估计网络模型。其原理是通过神经网络架构搜索技术分别构建Network级和Cell级网络架构搜索空间,利用可微分搜索(Differentiable Architecture Search,DARTS)算法动态搜索优化网络架构参数,得到最优的单目深度估计2D卷积网络模型。最后分别在Scene Flow、KITTI和NYU数据集上进行对比实验,分析并验证在单目深度估计领域通过神经网络架构搜索技术可以实现网络模型训练速度和单目估计精度两方面性能提升。(3)针对当前2D卷积网络模型提取深度特征信息性能不佳的问题,本文结合深度卷积网络多层级的尺度特征提取技术提出了一种基于3D网络架构搜索的单目深度估计网络模型。具体来说,本文将单目图像提取的2D多层级尺度特征构建成3D特征体,并使用三维卷积核和网络架构搜索技术自动构建单目深度估计3D网络模型。同时,针对网络模型深度层数加深导致梯度收敛速度明显变慢的现象,本文采用网络层的跳跃连接方式对网络架构进行优化。最后,分别在Scene Flow、KITTI和NYU数据集上进行实验分析,验证了本文提出的基于3D网络架构搜索的单目深度估计网络模型的可行性和有效性。
其他文献
多元智能理论认为智能结构是多元化的。学习多元智能理论可以帮助中职学生全面认识自己、接纳自己。多元智能卡牌以多元智能理论为基础,以120道题五点评分的多元智能量表为初始模板,根据当代中职学生特点,筛选出比较贴切的题目共64道题。卡牌正面是从量表中筛选出来的题目,背面是每项智能对应的颜色。本套卡牌在上海市城市科技学校2022级学生德育新课程“心理健康与职业生涯”中使用,实践证明,具有良好的课堂应用。
在众多的图像理论中,傅拉瑟的技术图像理论另辟蹊径,从装置和程序的角度理解现代图像的生成机制,打开图像研究的物质面向。然而,以往的研究大多将技术图像等同于现代媒介技术所生成的图像,忽略了传统技术在图像生产中的作用。本文聚焦编织这一人类古老的技艺,将编织产生的图像——织纹——与傅拉瑟的技术图像理论进行对话,尝试跨过现代与传统的鸿沟,看到一个不同的“技术图像的宇宙”。研究发现,织纹虽然产生自编织这一传统
老年糖尿病患者衰弱发生率较高,严重影响患者的身体健康和生活质量。该文主要对国内外老年糖尿病患者衰弱相关影响因素及干预措施进行综述,以期为临床实践和研究提供参考。
在过去几十年中,互联网与科技的巨大发展推动了大规模通信平台的产生,如微信和Twitter。每个平台都可以建模为一个社交网络,用来表示用户之间的关系和互动。当某个平台想要进行推广时,该平台应该如何选择网络中一组“有影响力”的成员来“引发”一连串的影响从而使得使用该平台的人尽可能地多。这就是社交网络中最经典的影响最大化问题。当多个平台同时在社交网络上实施相同的推广策略时,针对个人或单个公司在社交网络中
本文选择六版与《义务教育物理课程标准(2011年版)》配套的义务教育物理教材(人教版、北师大版、沪粤版、教科版、苏科版、沪科版)中的“光学”单元为研究对象,以物理课程与教材分析理论、物理教学论、物理学、教育心理学为理论基础,以《义务教育物理课程标准(2022年版)》、核心素养、物理学、学生学习心理等为依据,选择教材比较研究的指标,运用教育比较研究法等研究方法,对上述六版教材中的“光学”单元进行了比
随着新冠疫情的大爆发,如何有效处理突发公共卫生事件引起了人们的高度重视。通过对比分析国内外的研究现状,本文运用软件搭建、视屏播放和实时定位的技术,设计了一个用于突发公共卫生事件的应急处理系统。系统不仅适用于卫生监管部门的应急处理,还适用于广大群众,以提升公众对突发公共卫生事件的认知。
初高中物理衔接问题一直是中学物理教育研究的热点问题之一。相比初中物理而言,高中物理概念、物理规律更加的抽象,对问题的推理和判断能力要求更高,对数学计算的能力要求也更高。因此,高一阶段最重要的工作之一就是帮助学生尽快适应高中物理的学习节奏,减轻对高中物理问题的畏难情绪,提高物理问题解决能力。而物理问题解决能力的提升离不开学生思维活动的参与,但是由于思考过程的无法显性化,本文引入可视化教学,使教师和学
行人检测作为目标检测的一个分支,其发展势头强劲,在智能化的各个领域都体现出了极大的技术价值。该项技术不仅能为智能化领域的发展提供安全保障,还是如今交通安全系统中的核心技术之一。行人检测算法层出不穷,但大多数算法对简单环境下人较少的情况有很好的效果,对于严重遮挡的环境却无能为力,遮挡是影响行人检测性能的瓶颈。本文提出了一种基于注意力增强的行人与头肩级联检测算法,该实验基于ResNet50+DCN网络
近年来,我国市场环境因为经济发展水平的提高变得更加多样化,与此同时,各行各业也都面临着越来越大的竞争压力与发展压力,伴随着新一轮医改政策的推进,医药行业的市场环境发生巨大变化。特别是在当前的疫情形势下,许多企业都有可能陷入财务危机,而财务风险恰恰是造成公司财务危机的主要根源。因此,如何加强企业财务风险评价和控制就成为了摆在每一位企业管理者面前亟待解决的问题之一。企业要防范金融危机,其实质是防范公司
随着市场经济的发展,消费升级的加快,平台型电商的市场竞争越来越激烈,传统电商单一化的经营模式在激烈竞争中难以站稳脚跟,因此,许多平台型电商结合“社群”、“内容”等要素形成新型商业模式,整合多种资源追求价值共创,以赢得市场竞争中的优势地位。拼多多作为新兴平台型社群电商的代表之一,在“万物互联”的背景下,将“社群”要素嵌入到平台电商的运营中,打破了国内电商市场的“双极”格局,在平台型电商市场上掀起新浪