基于场景几何信息的显著性目标检测研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:lzflivecn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
显著性目标检测对于图像理解的进步至关重要,并且已在各种计算机视觉和图像处理任务中展现出巨大的潜力。现有的显著性目标检测算法根据输入图像类型可以分为RGB、RGB-D和光场方法三类。不同于RGB数据,RGB-D和光场数据通过深度图、多视角图和焦点堆栈提供了场景的精确几何信息,如此丰富的几何信息可以为显著性目标检测在挑战性场景下提供有效的显著性特征。然而,显著性目标检测作为许多任务的预处理步骤,要求高效且通用。为此,需要克服以下三个实际问题:基于几何信息的数据集在规模、类别和图像类型方面上的不足,导致深度模型泛化性受限的问题;实际应用中场景几何信息获取不便的问题;高维度几何信息处理带来的高消耗计算资源问题。为了应对上述挑战,本论文的贡献如下:(1)构建大规模通用数据集(DUTLF-V2),该数据集包含102个类别和4204个样本,可以同时支持RGB、RGB-D和光场显著性目标检测。(2)针对多视角图像获取成本高的问题,将显著性目标检测分解为两个子任务:光场多视角合成和多视角显著性目标检测。首先提出了一个光场合成网络,以生成高质量的多视角图像,然后提出一种新颖的多视角显著性目标检测网络,以有效整合多视角显著性预测图。该方法在多视角数据集上表现优于其他最先进的RGB、RGB-D和光场方法。(3)针对焦点堆栈计算资源和内存消耗大的问题,提出非对称双流网络。首先设计教师网络通过学习焦点堆栈来满足台式计算机端的高需求,同时将全面的聚焦知识传输至学生网络中。其次提出两种蒸馏策略来训练学生网络,确保性能的同时,提高学生网络的内存使用和计算效率。教师网络在三个光场数据集上取得了最先进的检测结果,学生网络则取得了前四的准确率,并与最先进方法相比,学生网络将模型大小最小化了56%,帧率提高了159%。(4)针对深度传感器采集深度信息风险高的问题,提出一种深度蒸馏器(A2dele),将网络预测图和注意力图作为深度知识传递的两座桥梁。在A2dele中,自适应深度蒸馏策略目的是实现RGB流所需的像素级深度知识传输,而注意力深度蒸馏策略致力于将定位知识传递至RGB特征中。本论文的RGB流在五个RGB-D数据集上取得了最优的性能,并与最先进的其他方法相比,将模型大小最小化了76%,帧率提高了11倍。此外,A2dele可应用于大幅度提升RGB-D方法的运行效率,并同时保持原有检测精度。
其他文献
随着5G时代的到来,移动电信网络服务正在由数据中心服务模式向分布式移动边缘计算(Mobile edge computing,MEC)服务模式过渡。在此背景下,网络功能虚拟化(Network function virtualization,NFV)技术逐渐受到关注,传统的网络基础服务例如网络防火墙、入侵检测系统和数据转码器等,可以应用虚拟化技术以虚拟网络服务(Virtual network func
进入21世纪以来人们的物质生活逐渐丰富,很多人不再是仅仅关注温饱问题,身体健康和生活品质逐渐受到人们的关心,越来越多的人们热衷于强身健体,其中羽毛球由于其简便、有趣、花样多的特点而受到人们的青睐。得益于科学技术的飞速发展,像智能运动手环、智能手表、智能鞋垫、智能头盔等产品在内的智能设备和网络技术也得到了迅猛的发展。这些智能设备会收集佩戴者的运动数据,通过佩戴者的运动数据得到佩戴者详细的运动信息,再
在能源过分消耗与环境持续破坏的大背景之下,工业领域对于汽车的轻量化技术提出了更高的需求。由于复合材料的优秀力学性能,使用复合材料代替汽车原有的金属材料,可以有效地减轻汽车的重量,提高续航里程,降低尾气排放,有利于环境保护与降低能源损耗。复合材料的性能与各组分材料的含量、性能、分布形式以及界面特性等密切相关,实验的方法难以进行多变量控制,有限元仿真的计算方法受限于计算机的性能,基于多尺度理论分析的解
车载内容中心网络是一种将内容中心网络概念应用到车载网环境下的网络架构,作为其基本特征的网络缓存使得缓存数据在多个节点间的共享成为一种高效数据访问方式。然而车辆的移动性和连接的稀疏性问题使得车辆与车辆之间缺乏良好的协调,导致各个节点缓存的内容冗余度高,缓存空间利用效率低下,路边单元(Road Side Unit,RSU)只能被动地处理来自车辆的请求,难以主动为车辆提供服务,无法充分发挥RSU的缓存能
近几年科技和信息的发展带动基础设施供应链迅猛发展,随之而来的基础设施安全问题也越来越被全世界关注。基础设施供应链在公共服务系统和物流链中一直扮演重要的角色,它越来越多被应用到机场,消防局,物流工厂等领域中。而这些设施在遭受到恐怖袭击或者自然灾害后可能对现代社会的经济发展和社会福祉产生巨大的危害,所以保护它们的安全是这些产业平稳运作的基本前提。在轴辐网络中关于枢纽拦截和枢纽保护还存在许多挑战难以攻克
随着科学技术的不断进步以及对竞技体育越来越高的目标追求,将信息化辅助工具应用在体育比赛与训练当中已经成为一种趋势。排球项目是国家重要的体育项目之一,教练及运动员一直在寻找排球训练环节中的突破点,希望通过制定更加有效的针对性训练方案,实现运动员各项运动水平的不断提高。对于训练中产生的大量训练内容,其分析与统计工作目前仍停留在经验判断以及人工统计层面,教练员主要通过现场指导以及观看训练视频回放的形式对
随着工业互联网的应用越来越广泛,其安全问题也开始逐步受到重视,在攻击者之前发现其存在的潜在安全隐患是十分重要的。模糊测试是一种常用且简单高效的漏洞检测工具,目前在工业互联网漏洞挖掘中也应用广泛。在传统的协议模糊测试方法中,生成测试用例需要花费大量人力和时间来对协议规范进行分析,且随着协议的改变,生成方法将不具备通用性。因此需要设计一种能降低协议分析成本且能得到较好测试效果的模糊测试方法。近年来随着
石油炼化行业是我国重点耗能产业,随着人们需求的增加,生产规模不断扩大,能源需求量随之提高,节能降耗成为当下工作的重点。常减压装置在炼油过程中能耗占比最大,且负责重点产品的产出,其能效水平直接关系到能源的利用效率和企业的经济效益,因此面向常减压装置进行能效评估和能效优化的研究具有重要意义。本文以国家863项目“面向石化工业能效监测评估及优化控制技术与系统”为背景,针对常减压装置单位综合能耗产出量这一
网络在信息化的社会中已经拥有不可取代的地位,然而频发的网络安全问题也不可被忽视,与教学和生活息息相关的校园网也是如此。出口带宽限制、威胁事件突发等问题都会带来严重的后果。防火墙的部署能够有效管理网络,其产生的日志中包含各种信息,分析这些数据能够及时了解网络状态。然而防火墙等网络设备产生的日志数量增长过快,如何高效地完成对海量日志数据的处理,又是一个亟待解决的难题。基于以上的问题和需求,本文以防火墙
铝电解电容器是寿命敏感器件,随着时间的推移,其参数退化到一定程度时,必然会影响电路板的寿命,故而研究其退化规律与寿命特征是至关重要的。文章从铝电解电容器结构和退化机理出发,将温度作为加速敏感应力设计了加速退化试验,并采用加速退化数据进行寿命预测,给出了延长铝电解电容器使用寿命的正向设计方向;从状态修的需求出发,提出了基于BP神经网络的铝电解电容器剩余寿命预测方法,其预测数据来源既可以是现场实测数据