多视图目标视角估计与三维重建方法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:jsptpd_dryy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字处理技术的发展使得对图像进行分析、操作和处理,最终转换为计算机可识别三维模型的方法越发高效,相较于无须考虑视角影响的单张图像,多视图三维重建因自然图像标注视角的缺乏而面对不小的挑战,如何高效利用图像特征实现自然图像的目标视角估计与三维重建已经成为亟待解决的问题。现阶段,各类别图像视角估计模型独立不相关且三维重建模型大多仅利用了单张图像的深层语义特征,模型参数冗余且图像特征利用单一。由于多视图目标视角估计与三维重建最终需要应用于自然图像,如果目标视角估计准确性太低,或重建时没有充分利用三维模型特性及图像特征,必然对重建模型精度造成影响。因此,对多视图进行视角特征分析及有效特征提取具有重大意义。本文以自然场景下的目标多视图为对象,提出基于参数共享的图像目标视角估计方法服务于多视图三维重建,同时为了提高重建精度,进一步提出了视角标注下多视图感知特征提取与融合方法和基于图卷积网络级联的网格三维重建方法。主要研究工作如下:(1)基于参数共享的图像目标视角估计研究。针对自然图像缺乏视角标注重建应用困难、训练样本匮乏及训练周期长的问题,根据原始数据集参数的分布情况合成模拟自然图像;考虑到目标的尺度差异性对视角估计的影响,选定合适的检测网络;由于并行多类别视角估计模型存在参数过量、移植性困难的问题,考虑到不同类别图像的浅层特征的一致性及视角特征的空间距离关系,在优化视角估计损失函数的基础上,结合卷积神经网络提出基于参数共享的图像目标视角估计方法。实验证明,该方法在减少训练耗时的同时能有效的估计图像的目标视角。(2)视角标注下多视图感知特征的提取与融合方法研究。针对多视图浅层空间特征利用不足和特征融合效果较差的问题,结合深度学习,提取多视图的多尺度特征。在此基础上,以网格作为重建目标的三维表达形式,通过各视图的标注视角获取网格顶点的投影坐标,采用双线性插值法进一步提取多视图多尺度感知特征并提出基于多视图统计特征级联的感知特征融合方法。设计实验对比不同感知特征提取网络结构与特征融合方法应用于三维重建的效果,实验证明,视角标注下多视图感知特征的提取与融合方法能有效提升三维重建网络的性能。(3)基于图卷积网络级联的多视图三维重建方法研究。针对传统的卷积神经网络无法直接应用于不规则网格变形的问题,在提取多视图感知特征的基础上,建立图卷积层之间的密集跳跃连接并提出基于图卷积网络的网格三维重建方法,通过采用图卷积网络和五种损失函数实现和约束网格变形。同时为了增加模型细节,设计基于图的上采样层,通过级联多个图卷积网络和上采样层实现网格三维模型由粗到细的精确重建。
其他文献
随着我国经济与公路基础设施建设的持续快速发展,公路货运量和客运量保持高增长态势,公路安全成了保障全国经济发展的重要一环。保障公路安全离不开路面破损检测。传统的人工走查的检测方式成本高、检测时间长、受视觉主观性影响,并且可能危害检测人员的生命安全。因此,路面破损自动化检测方法的研究具有重要意义。目前,国内外的路面破损检测方法中,多数局限于对裂缝破损的检测,少数能检测多种破损,但检测精度不高。本文针对
学位
光纤布拉格光栅(Fiber Bragg Grating,FBG)是当前光纤传感领域中发展和研究潜力最大的光纤类传感器之一。对FBG大规模组网,通过波长漂移和位置信息,可以实现对复杂工况的分布式传感监测。在现有的技术中,基于干涉和时分复用的FBG波长解调系统具有大容量、解调速率高的优势,但由于使用的宽谱光源一般需要添加带通滤波器滤除底噪,而光源信号的相对强度噪声随带宽的下降而上升,导致系统的信噪比较
学位
在包括强度、波长、频率、偏振态等多种光纤传感调制形式当中,基于光学干涉的相位调制型光纤分布式声学传感(Distributed Acoustic Sensing,DAS)技术具有极高的灵敏度和广阔的应用前景。然而,在现有的光纤DAS系统中,普遍采用单波长或者合成波长进行光干涉测量和相位解调,其局限性在于相邻采样点之间的相位变化不能超π,否则必须提升解调系统采样率,这会极大地加重大容量长距离DAS阵列
学位
关系抽取作为自然语言处理中的重要研究领域之一,旨在发现半结构化与非结构化文本中存在的关系类别信息,在知识图谱的构建、问答系统的搭建和信息检索的优化等多个场景中都有着广阔的应用前景。远程监督研究以现有知识库的三元组信息对标待处理文本,减少人力资源投入的同时亦可获得较好的分类效果,是目前主流的关系抽取手段。然而受其基于的假设影响,生成的训练语料中不可避免地引入了标签噪声,如何减少训练过程中噪声数据对关
学位
声源定位在军事和民用领域具有广泛的应用和无可替代的价值,采用麦克风的声源定位技术是最主要的定位方法之一,但麦克风不具备遥感能力,不能抗电磁和射频干扰。光纤光栅分布式声学传感(Distributed Acoustic Sensing based on Fiber Bragg Grating,FBG-DAS)技术因为具有灵敏度高、体积小、抗电磁干扰和分布式远距离传感等优势,在某些领域已经替代传统麦克风
学位
碳化硅(Silicon Carbide,Si C)优异的物理化学性质使其可以在高温高压等极端环境下工作,被认为是最有前景的第三代半导体材料之一。但是Si C是间接带隙半导体,发光效率低,发光难度大,限制了其在光领域的应用。本文针对这一点,利用光子晶体结构和量子限域效应,设计了三层结构的二维光子晶体的Si C纳米薄膜,使用磁控溅射法制备了荧光Si C薄膜,增强了Si C的光致发光性能。(1)使用扫描
学位
图像重着色是图像处理的一个流行领域,被广泛地应用于美术、电影、色盲可视化等领域中,其关键是要根据用户的意愿,将图像中的某一部分的颜色自然生动的变成另一种颜色。基于调色板的图像重着色算法是近年来实现图像重着色的最热门的算法,但其在对复杂光照下的自然图像重着色时,实验结果产生了颜色失真,溢出以及光照信息变化等问题。针对上述问题,本文将自然图像重着色任务分为调色板提取和图像重着色两部分进行了研究,主要研
学位
脑卒中存在着高复发率、高死亡率和高致残率的问题,脑机接口(Brain Computer Interface,BCI)技术作为一种新的信息交流方式,能够有效应用于脑卒中领域的医疗康复。脑卒中患者通过运动想象(Motor Imagery,MI)脑电(Electroencephalography,EEG)信号可以完成对外部设备的直接控制,该过程具有自发性和积极性,有助于诱导患者进行大脑神经回路重塑,从而
学位
在当前的公钥密码体制中,对用户私钥保护的主要措施有专用密码硬件、可信执行环境、软token验证、秘密共享等等,其中专用密码硬件安全性高,但成本过高且不易携带;可信执行环境与软token验证成本相对较低,但容易受到黑客攻击。秘密共享对于用户私钥的秘密采取分开保存的方法,只有获取所有的秘密份额才能破解用户私钥,具有成本低、灵活性好、安全性高等优点。SM9是国家密码管理局发布的基于双线性对映射的公开密码
学位
无人船具有安全性高、高效灵活、可以节约人力物力等优势,是一种新型的平台,具有很大的发展潜力,近年来受到了各个国家的关注。无人船在港口挂靠期间,需要根据所处场景控制船体航行状态,因此水上场景识别技术是无人船智能化发展的重要保障。尽管可以利用现有的基于深度学习的场景识别方法,从海量的视觉数据中学习到不同的模式,训练出具有泛化能力的模型对水上场景图像进行识别,然而针对水上场景图像存在的包含特征丰富、标志
学位