基于单目室内场景的深度估计算法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:amyzi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度估计一直是机器视觉领域中重要的研究课题。早期的深度估计是基于场景中的几何约束信息从而得到深度信息。后来出现了单目深度估计算法。近年来随着人工智能技术的高速发展,深度学习方向炙手可热,基于深度学习的深度估计算法发展迅猛使得深度估计有了更广泛的应用,比如:实地测距,机器人导航,自动驾驶等等。但现在大部分深度估计算法主要用于室外场景,而室内场景下的深度估计,由于该类场景没有显著的全局或局部特征,场景物品繁杂,深度值十分稠密、连续性高;因此基于室内场景深度估计算法的研究仍待突破。针对单幅图像的室内场景深度估计的问题,本文提出了一种基于多种网络,即全卷积网络(FCN)分别与通道注意力网络(SENet)、残差网络(Res Net)结合的编码器解码器结构。该网络采用端到端的训练方式,不采用任何的后处理技术。首先将全卷积网络与通道注意力网络结合设计了全卷积通道注意力网络模块(FCSE块),将FCSE块和卷积层按照一定规则交替排列在编码器中,同时利用空间信息与信道信息,输出高质量的特征图。然后利用Res Net的特点——跳层连接,将全卷积网络与残差网络结合设计了Trans上采样模块,并按照一定规则排列在解码器中,加深解码器网络,可以比较完整地恢复下采样后的特征图深度信息,提高深度图的精度,减少网络训练所用时间。最后,使用L1损失函数进行模型的优化。本文提出的算法在最常用的室内公开数据集NYU Depth v2上进行训练与测试。和现有的其他单目深度估计方法相比,本文所提出的网络模型不仅精简了繁琐的精化粗图的过程,而且所预测的深度图精度更高,错误率的降低不少于1.6%,阈值精度提升不少于0.5%,运行网络结构的平均用时21ms,为实现实时检测奠定了基础。最后的实地测距结果表明,算法测量结果与实际深度测量的平均误差率为4.40%。
其他文献
当前我国交通基础建设规模逐步增大,互联网的飞速发展也为交通出行带来了更多的可能性。在这样的信息化时代中,面对交通方式的多元化和复杂化,课题组构建了智能情报分析框架IAF,基于复杂网络挖掘算法对地、事、人、行为及相互关系进行感知、理解、预测。其中异常检测是该框架中的关键算法,基于交通复杂网络的情报分析是该框架中的重要功能。本文利用物理空间获取共享单车、网约车等大量车辆的城市交通出行行程数据和轨迹数据
函数名称预测是代码分析中的一项重要下游任务。优秀的函数名称可以增加程序或者代码的可理解性,帮助开发人员轻松的理解他人的代码,这对软件产品的扩展和维护至关重要。近年来,研究人员提出了大量不同的函数名称预测模型,而随着机器学习的发展,函数名称预测方法逐渐从传统的代码分析方向转变到深度学习代码表示上,各种基于机器学习的函数名称预测工具层出不穷。但是在利用机器学习的模型完成函数名称预测任务上,仍然存在两个
截止2019年PubMed数据库中收录的生物医学文献超过了三千万篇,从这些文本中挖掘出有效的生物医学信息用于疾病诊断和新药研发等领域成为研究的热点,而生物医学事件抽取是其焦点问题。生物医学事件抽取的主要任务包括事件触发词和事件元素识别,目前的相关的研究存在未能充分挖掘文本语义特征和数据样本标注不足的问题。针对触发词识别中未能充分挖掘文本语义特征的问题,本文提出了基于多角度学习关键语义信息的方法,该
社会关系的研究在社会学领域中一直是一个重要的话题。随着互联网技术与社会媒体平台的蓬勃发展,越来越多的人活跃在社会媒体中。这为社会关系的研究提供了一个新的途径。人们在社会媒体中的交互是现实社交在网络上的映射,这为通过社会媒体研究社会关系提供了可靠性。并且,海量社会媒体数据也为社会关系的研究带来了极大的便利。本文旨在通过社会媒体数据进行多元化社会关系画像。多元化主要体现在数据的多元化和方法的多元化。数
移动边缘计算是指在移动网络边缘部署存储和计算资源,为移动网络供应云计算能力和IT服务环境,从而为移动用户提出高带宽和超低时延的网络服务解决方案。计算卸载在移动边缘计算中是一项关键技术,可以为资源受限设备运行计算密集型应用提供计算资源,加快计算速度,节省能源。移动边缘计算中的计算卸载是将移动用户终端的计算密集型任务卸载到边缘环境中,弥补了终端设备在计算性能、资源存储以及能效等方面存在的不足。移动用户
云计算由于其强大的计算和存储能力得到了广泛关注,但是远距离传输带来的高延迟对用户体验产生了不利影响,本文通过引入移动边缘计算技术,利用边缘节点天然的地理位置优势,将一个区域内的闲置计算资源整合成一个分布式边缘计算平台,使其提供快速,高效的即时响应。为了解决分布环境中的用户身份安全问题,本文引入区块链技术实现用户之间的可信交易。面对共识过程中产生的“冷启动”和“长期回报”,本文引入银行借贷机制,解决
知识图谱是由实体和关系组成的有向图,图中的节点表示现实世界中的各种事物实体,图中的边表示这些事物实体之间的相互关系。但是知识图谱通常都是不完全的,会有大量的关系缺失,通过人工的方式补全这些缺失的关系,需要消耗大量的人力和时间。因此,知识表示学习被提出来,通过将实体嵌入到连续的低维向量空间中,进而实现知识图谱的自动补全。现在已有很多知识嵌入方法,一般将其分为两大类,第一类是以Trans E为开端的基
近几年,我国公共建筑领域的发展趋势是公共建筑的档次越来越高,功能越来越复杂,高能耗建筑占新建建筑的比例越来越高。作为建筑能耗占比最大的一部分,公共建筑暖通空调系统在实际运行过程中缺乏有效的调节手段。目前对于公共建筑节能诊断的研究主要从两个角度考虑,分别基于专家知识和基于数据挖掘来进行,但多数研究工作仅从一个角度考虑,将节能诊断工作进行非常细致地推进,但这样往往会造成测试工作量过大或诊断方法过于复杂
城市交通系统作为城市系统的重要组成部分,在城市风险研究中不可或缺。城市风险的防范与监测需要将城市交通出行特征纳入考量范围。对于交通出行轨迹数据进行挖掘,可以发现城市居民的移动规律与城市系统空间的交互特征,进而刻画出整个城市的交通出行画像。本文以描绘城市交通出行画像为出发点,研究如何高效地挖掘出行轨迹数据,探索这些行驶轨迹形成的原因,开展了以下工作:首先,提出了基于频繁模式挖掘的城市交通出行画像方法
古代壁画是是中国古典艺术的宝库,是中国历史和文化的见证,是我国宝贵的历史文化遗产,其历史研究价值更是无法估量。然而在外界环境及人为内在因素的影响下,大部分壁画如敦煌莫高窟、西千佛洞等壁画群均出现不同程度的裂缝、脱落、酥碱、霉变等多种形式的病害。为了长久地保护这些珍宝,修复壁画中的破损部分精准还原壁画内容,是一项亟需研究且具有重大意义的内容。与传统手工技术相比,数字化技术的出现给古建筑壁画修复带来了