【摘 要】
:
建筑物图像语义解析是计算机视觉中一个重要研究课题,在三维语义重建、文化遗产数字化保护、智慧城市等多个领域有着极大的应用价值。然而,建筑物图像噪声较多:1)由于光照不均匀、玻璃反光、窗户开关状态不同等原因导致建筑物立面不同区域相同元素表观差异大;2)建筑物前方经常存在未知类型、形状和大小的遮挡物,这些均为建筑物解析带来极大挑战。本文针对建筑物图像中存在的不同程度的噪声问题,从空间结构上下文建模、元素
【基金项目】
:
国家自然科学基金面上项目:“基于多视点图像序列的三维场景稀疏结构与语义重建”; 模式识别国家重点实验室开放课题基金项目“三维场景语义结构重建关键技术研究”;
论文部分内容阅读
建筑物图像语义解析是计算机视觉中一个重要研究课题,在三维语义重建、文化遗产数字化保护、智慧城市等多个领域有着极大的应用价值。然而,建筑物图像噪声较多:1)由于光照不均匀、玻璃反光、窗户开关状态不同等原因导致建筑物立面不同区域相同元素表观差异大;2)建筑物前方经常存在未知类型、形状和大小的遮挡物,这些均为建筑物解析带来极大挑战。本文针对建筑物图像中存在的不同程度的噪声问题,从空间结构上下文建模、元素分布规则学习、特征表达学习和多视角信息融合等角度提出深度学习算法,以准确解析建筑物图像。所完成具体工作如下:1.提出融合空间结构上下文的建筑物图像语义解析方法(Pyramid Atrous Large Kernel Network,Pyramid ALKNet)。该方法基于建筑物结构特点,在多尺度特征空间聚集丰富的长距离结构上下文线索,能够有效处理建筑物元素表观差异等噪声问题。2.提出基于元素分布规则学习的建筑物图像语义解析深度学习框架。该框架的核心为基于建筑物元素分布规则所设计的重复模式修复网络(Repetitive Pattern Completion Network,RPCNet)。该网络结合图像可见部分线索,迭代推理遮挡区域的语义内容。与Pyramid ALKNet相比,RPCNet在较大遮挡区域生成的解析结果更准确。3.提出基于渐进式特征学习的建筑物图像语义解析方法(Progressive Feature Learning Network,PFLNet)。该方法基于贝叶斯卷积神经网络的不确定性计算噪声区域,通过渐进式学习策略,从外到内、从易到难,基于上下文重新表达噪声区域特征。与RPCNet相比,PFLNet在较大遮挡区域内,能够生成质量更高的解析结果。4.在Pyramid ALKNet基础上,提出基于多视角特征聚集的建筑物图像语义解析框架(Multiview Feature Aggregation Network,MFANet)。该框架的亮点在于跨视角特征聚集模块(Cross-view Feature Aggregation Module,CFAM)。该模块通过学习如何从邻近视角选择并融合有用信息,实现目标视角的特征增强。受益于多个视角信息的增强,与Pyramid ALKNet相比,MFANet能够更为有效应对噪声问题。另外,所提出的CFAM模块具有较强的移植性,可与现有单视角图像解析方法实现集成。
其他文献
近年来,中国在全球价值链的参与以及分工逐渐深入,中国企业在积极利用海外资本与先进技术的同时,也逐步具备了向海外市场拓展的实力,一批先进的中国民族企业将本国优质产品和服务推向世界市场。在“一带一路”倡议背景下,随着中国制造业的产能释放及其强劲的成本优势,同时得益于互联网持续的全球渗透,企业进入海外市场的模式也发生了深刻的变革和创新。与此同时,随着全球政治、经济、安全问题日益复杂,国际格局演变日益加剧
微流控芯片是一种在微米或亚微米尺度下对流体进行精确操控的芯片,其目的是将实验分析设备微型化和集成化,以最大限度地将实验室的功能集成在一块毫米级别的芯片上。由于微流体的雷诺数小,从而产生明显的层流现象,使得不同溶液之间混合缓慢。微混合器就是快速实现微混合的微器件,是微流控芯片的重要组成部分。体声波激励的微混合器由于具有结构简单、易于操作、生物相容性好、响应速度快等优点而引起了国内外学者的注意。现有的
随着科技的进步,与互联网有关的各种新兴的技术急速发展,互联网上各式各样的信息也越发的纷繁复杂,并且引发了严重的信息过载问题。通过深度学习对大量的多源异构数据进行整合,并将其与推荐系统进行深度融合,使推荐模型更加贴合用户的需求,从而提高推荐算法的性能,成为目前融合深度学习的推荐算法的一项十分重要的任务。在实际应用中,由于用户和物品的交互数据十分稀疏,算法无法高效地获取新用户和新项目的重要特征,降低了
在“工业4.0”科技革命与产业升级背景下,国内外科研机构研制了形式多样的智能制造示范产线。这些示范产线不仅展示了“工业4.0”领域的前沿成果,还为相关理论研究、教育教学和软硬件产品测试提供了试验床。然而,现有示范产线受限于其规模与功能,往往无法满足面向复杂场景的生产调度问题研究。本文通过引入可重构制造系统理论,针对示范产线提出了一种生产调度可重构模型系统基础架构以及基于多智能体的可重构建模方法,并
在现有的腔镜手术中,扶镜医生需要手持内窥镜,配合着主刀医生的操作实时调节内镜视野,并保持视野稳定。该作业过程耗费体力大,挤压主刀医生活动空间,浪费医疗专家资源,医院迫切需要一种机器人辅助技术,替代扶镜医生作业,在人机共融场景下完成腔镜手术。然而,由于缺少通过人机协作实现扶镜作业的控制方法,也缺乏基于术中图像引导的内窥镜自主调节方法,机器人在实际腔镜手术中的应用推广受到了制约。为解决以上问题,本文提
恶性肿瘤是影响人类身体健康的主要疾病之一。随着肿瘤发病率和死亡率逐渐升高,对肿瘤患者的治疗也越来越迫切,目前癌症的治疗主要有化疗、放疗、手术外科治疗和靶向治疗。其中靶向治疗是治疗癌症的最有前景的手段之一。而多靶点治疗相比单靶点具有抗耐药性、可协同性等优点。本研究工作在实验室前期研究工作基础上,设计合成了新型二噁烷并喹唑啉化合物,使用HPLC、~1H NMR、13C NMR和HRMS进行纯度分析和结
信息技术的不断发展,使得国际贸易理论的本质与现实的国际分工形式均发生了重大变革,要素和信息的非自由流动、产品差异化成为当前国际贸易理论体系的两个显著特征。互联网的广泛运用降低了搜寻成本,提高了经济主体间的沟通效率,极大推动了国际贸易的发展。而金融危机后新贸易保护主义的高涨激化了各国间的贸易摩擦,阻碍了国际贸易市场一体化进程。对于中国来说,传统的关税和非关税壁垒对于国内产业的保护作用日益削弱,出口企
超结构因其独特的微观结构设计而展现出超常的物理和力学特性,其中负泊松比力学超结构因其特殊的变形模式和优异的力学性能,而受到广泛地关注。智能材料是一种能感知并响应外部刺激的新型功能材料,拥有很多普通材料不具备的特殊功能。将超结构与智能材料结合,可以制备出具有自感知和自驱动功能的智能超结构,实现结构和功能的一体化。本文主要在常规负泊松比超结构的基础上,结合形状记忆聚合物(SMP)和水凝胶这类智能软材料
行人重识别是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术,被广泛认为是一个图像检索的子问题。旨在弥补固定位置的摄像头的视觉局限,并可与行人检测技术相结合,广泛应用于智能视频监控、智能安保等领域。由于不同摄像设备之间的差异,同时行人兼具刚性和柔性的特性,外观易受穿着、尺度、遮挡、姿态和视角等影响,使得行人重识别成为计算机视觉领域中一个既具有研究价值同时又极具挑战性的热门课题。为了进
交通标志对于道路交通安全至关重要。在真实的驾驶场景中,存在光照变化、交通标志的形变、车速等影响,人眼可能会遗漏或错误识别交通标志,导致对前方路况的错误判断,引发交通事故,造成人身财产和车辆损失,甚至威胁生命安全。实时准确的交通标志检测技术作为先进驾驶辅助系统的重要组成部分,能够协助驾驶者保障行车安全,避免危险的发生,在交通安全和自动驾驶等领域具有重要的应用。近年来,深度学习技术的快速发展以及大数据