数据驱动的室内场景三维重建与语义理解

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:aghiiuooo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
室内场景重建与理解是计算机视觉、计算机图形学以及机器人学中的难点。作为室内场景导航、推理等复杂任务的核心问题,室内场景重建与理解是室内服务型机器人的基础。随着工业和娱乐领域对数字几何需求的不断增长,对室内场景进行分析理解比过去任何时候都更加重要。近年来深度扫描技术的快速发展使得室内场景的数据获取方式越来越多元化。由于这一技术革新,室内场景的重建和理解技术经历了由简单到复杂以及由低维到高维的发展演变,通过三维数据对室内场景进行重建和理解是当前该领域中的热点和难点之一。
  另一方面,随着大数据时代的到来,数据驱动方法在多个领域逐渐崭露头角。在计算机视觉和计算机图形学的多个应用当中,数据驱动方法已被证明是一种能够有效分析几何数据中结构和语义的方法。而随着三维数据量的不断增大,越来越多的数据驱动方法被用来解决三维室内场景的重建和理解问题。
  本文研究数据驱动的室内场景三维重建与语义理解技术。在室内场景三维重建方面,本文研究了基于平面共面性检测的重建方法。在室内场景语义理解方面,本文研究了基于递归自编码的物体检测方法。在主动式室内场景物体分析方面,本文研究了考虑场景分割的物体高精度重建方法。论文主要创新点包括:
  1.面向三维场景重建的共面性检测网络:当关键点无法被检测时,平面可以作为关键点之外的重要约束因素。利用平面的共面性信息增强重建效果是三维场景重建的重要发展方向之一。本文提出一种面向三维场景重建的共面性检测网络以及一种基于共面性约束的三维重建方法。其中,共面性检测网络能够在相对位姿未知的情况下直接检测不同帧间平面的共面信息。基于共面性约束的三维重建方法能够同时对平面的共面性约束和关键点约束进行优化,计算得到考虑平面共面性的三维重建结果。该方法的重建精度显著优于基于关键点的传统方法。
  2.基于递归自编码器的三维场景语义理解方法:场景的结构信息和上下文信息在室内场景分析中起到了重要的作用。本文提出一种基于递归自编码器的层次三维场景语义理解方法。该方法首先用层次结构对场景数据进行组织,然后通过递归自编码器传播场景的上下文信息,进而检测场景中的物体。该方法能够有效获取场景的上下文信息,并且在两个物体检测公开数据集上取得性能第一。
  3.机器人主动式三维场景重建与分析:本文提出一种机器人主动交互式的三维场景重建方法。在该方法中,场景的扫描重建与物体分析相互关联:对场景的扫描重建能够为分析场景中的物体提供数据来源,而物体分析反过来能够用来评估场景的重建质量。机器人首先会对场景进行初始扫描,然后对扫描得到的场景进行物体分割,对于确定性低的区域,机器人使用机械手臂与之进行交互(推动物体),进而验证物体分割的结果。场景分割方法基于一种在线学习模型,推动验证获取到的信息被用来对该模型进行在线更新。方法的最终输出是对场景中物体的高精度重建和分割。
其他文献
电驱动车辆是指一类由电动机直接或间接驱动车轮运行的运载对象,主要包括乘用电动汽车和特殊用途的电动轮车,因其具有节能减排的优势为应对气候变化与推动绿色交通的重要运载工具。然而此类车辆面临着所谓“里程焦虑”与节能降耗需求。加大电池容量与能量密度、快速充电技术、充电站布局等是目前解决“里程焦虑”的主要途径,但依然存在着车重增加,电池安全与充电站覆盖等诸多问题。为此,基于行驶状态估计的车辆能耗优化控制(亦
数字IC集成电路,尤其是FPGA硬件电路的版权保护技术是半导体技术发展的重要核心问题之一。目前尽管部分核心技术产品已得到了众多半导体公司及研究机构的广泛应用,但是IC芯片硬件安全技术在给设计者带来安全保障的同时,也带来了许多潜在的安全隐患。因此,如何研究解决IC芯片电子产品中FPGA硬件电路版权的安全保护与实时认证问题,已成为了当前FPGA硬件安全电路设计领域急需解决的问题之一。本文利用信息隐藏、
学位
水产养殖是农业的重要组成部分,多年来产量处于是世界首位,是一个不断发展的综合性研究领域。为了深入了解水产养殖业发展现状及发展趋势,以及渔民喂养方式和获取信息途径,我们前往“浙江省淡水水产研究所八里店实验综合基地”实地调研,通过一个月的实地观察以及工作人员和周围养殖户的反馈,我们发现养殖户多以经验养殖为主,养殖技术以及鱼病预防等措施更新不及时,遇到问题虽通过网络途径查询,却出现各种错综复杂的信息,导
学位
随着精准农业概念在我国的进一步推广,农业生产对智能机器人的需求也变得更加的旺盛。在农业智能机器人领域,目标障碍物识别技术一直是关系到机器人能否自动行走避障的关键。本文提出了一种基于立体视觉的光谱聚类算法,并把该算法应用到农业智能机器人障碍物检测的研究中。  本文为了降低在伪目标存在的条件下,由于伪目标的干扰引起的算法误检概率,进而提高本系统在非结构化的复杂环境中对目标的有效识别能力,提出了一种基于
随着互联网科技的迅猛发展,人类已经进入了一个信息大爆炸的时代,如何从繁杂的信息资源中提取有效的信息成为了学者们研究的重点内容,谷歌、百度等搜索引擎的出现很好的解决了这一问题。它能够对用户提交的查询请求进行处理,返回给用户想要搜索的信息。  目前虽然我国拥有很多涉农网站,如中国农业信息网、中国农村网、农联网、农业智能搜索网等,这些网站拥有丰富的农业信息资源,符合农业用户的查询要求。但是由于没有规范的
学位
我国作为农业大国,无论是农业在国民经济体系当中所占的比重还是我国的农耕土地面积都是在世界上处于前列的位置,同时随着我国的国家经济的飞速发展和改革开放之后我国经济的快速腾飞,无论是农业的技术水平和果树的种植产业都有了极大的提升和发展,水果和农副产品在人们的日常生活当中的比重和消费都呈现迅速增长的趋势。自1993开始我国成为世界第一水果生产大国之后,无论是果园的播种面积还是水果总产量,还是人均水果产量
学位
在机器学习/数据挖掘的众多研究分支中,异常检测一直是最为重要并且最具有挑战性的课题之一,其也被称为单类别分类/新奇点检测/离群点检测等。具体来说,异常检测致力于从一个数据集合中检测出与观测到的数据常见行为最为不相符的那些异乎寻常的数据模式,换言之,其将数据分类为正常类别和异常类别。异常检测有着非常广泛的应用领域,例如网络入侵检测、欺诈检测、工业故障检测以及智能图像视频处理与理解等。与传统的分类问题
学位
图像作为记录生活、分享信息的重要手段,是大数据时代最主要的非结构化数据形态,其应用领域已经深入到人类生活和工作的方方面面,然而,一方面,随着手机、平板电脑、摄像头等各种图像采集设备的广泛使用,图像的规模正呈现出爆炸性增长的趋势;另一方面,图像的处理和分析(如特征提取、物体检测、目标识别、图像检索等)通常包含非常复杂的计算过程。因此,大规模图像数据已经远远超过了资源受限的终端设备的存储和计算能力。 
学位
构建于大量节点之上云存储方便易用、成本低廉且可弹性扩展,被广泛用来保存人们快速产生的海量数据。根据节点分布,云存储可分为单中心云存储、跨中心云存储和P2P云存储三类。前二者通过运营包含大量服务器的一个或多个数据中心来提供服务;P2P云存储则通过大量租用个人闲置的存储空间和网络带宽来提供服务。对于任何一类云存储,采用容错技术以保证数据不因节点失效而丢失都至关重要。基于纠删码的容错技术容错能力更强且存
学位
随着智能移动设备和移动通信技术的发展,诸如Uber、滴滴打车等基于位置的服务广泛应用在人们工作生活的各个方面,给人们提供了巨大的便利。但是在使用基于位置的服务过程中,位置服务提供商也获取了大量来自用户的隐私位置数据,使得用户隐私面临严重威胁。一方面,位置服务提供商可能在经济利益的驱使下,对用户位置数据进行非授权的分析建模,提取并挖掘用户的行动模式、家庭住址、工作单位、收入水平、消费倾向等隐私信息。
学位