【摘 要】
:
目标检测作为计算机视觉领域最具基础性和挑战性的核心任务,在安防监控、行人检测等实际领域有着广泛的应用。低光照环境的多样性给各类目标检测算法带来了严峻的挑战,制约了其在全天候交通监测、自动驾驶等复杂场景下的应用。因此,低光照场景下的图像增强、目标检测等相关理论和技术研究具有重要的现实意义和应用价值。本文从低光照图像增强和目标检测两个方面入手,聚焦低光照场景下的目标检测算法并开展了探索与研究。一方面,
论文部分内容阅读
目标检测作为计算机视觉领域最具基础性和挑战性的核心任务,在安防监控、行人检测等实际领域有着广泛的应用。低光照环境的多样性给各类目标检测算法带来了严峻的挑战,制约了其在全天候交通监测、自动驾驶等复杂场景下的应用。因此,低光照场景下的图像增强、目标检测等相关理论和技术研究具有重要的现实意义和应用价值。本文从低光照图像增强和目标检测两个方面入手,聚焦低光照场景下的目标检测算法并开展了探索与研究。一方面,由于实际场景中缺乏低光照和正常光照配对图像,本文提出了一种基于生成对抗网络的低光照图像增强算法,针对现有方法存在过度增强、噪声放大等问题,对现实低光照场景中的图像增强方法进行了探索;另一方面,本文提出了一种基于动态增强网络的端到端低光照图像目标检测算法,在低光照图像增强的基础上,研究如何提升低光照场景下目标检测算法的性能。本文的具体工作如下:1.针对低光照场景下存在的亮度低、对比度低、噪声多等图像质量问题,提出了一种基于生成对抗网络的低光照图像增强方法,无需配对数据即可从低光照图像恢复出高质量的正常光照图像。首先,通过构造曝光和噪声参考图像作为生成器的额外输入,引导生成器关注欠曝光区域和图像中的噪声。其次,本文在生成器中引入了全局自注意力模块,利用自注意力机制建模图像的全局语义表示,使得生成器在增强图像的过程中得以关注全局信息。同时,通过为生成器添加感知损失和全变分损失来约束增强图像的内容一致性和平滑性。最后,本文提出了基于全卷积网络的多尺度判别器,以帮助判别器高效地捕获图像的全局和局部特征,引导生成器生成整体质量和局部细节俱佳的增强图像。在公开数据集的标准测试图像上的实验结果表明,本文提出的方法可以有效地生成视觉感受良好的高质量图像,且在定量指标上相对现有方法有明显优势。2.为了解决现有低光照图像增强方法对目标检测性能提升有限的问题,提出了一种端到端的低光照图像目标检测方法。在增强阶段,本文使用数个增强子网络模拟一组增强方法,并在此基础上进一步抑制噪声和提高对比度。增强子网络包含两个部分,动态滤波网络用于生成特定于样本卷积核对输入图像进行滤波,自适应曝光模块则生成对应图像的曝光图以增强图像的暗部细节。增强阶段同时给出一组对应增强子网络的权重,表示对应子网络对检测结果的影响程度。检测阶段基于经典的两阶段目标检测算法,通过增强阶段输出的权重对区域建议网络的分类损失加权平均来生成高质量的区域建议,进而提高检测器的整体性能。本文在公开的低光照目标检测数据集上进行了验证实验,结果表明本文方法可有效提升检测性能。
其他文献
研究目的:2018年12月,国务院办公厅下发《关于加快发展体育竞赛表演产业的指导意见》表示,体育竞赛表演产业已成为推动体育产业向纵深发展和建设健康中国的重要引擎。2019年,习总书记召开中央经济会议时强调:"我国经济稳中向好、长期向好的基本趋势没有改变。要推动生活性服务业向高品质和多样化升级,加快发展数字经济"。系列决策部署指明了数字经济已成为我国经济高质量发展的驱动力,对于推进体育竞赛表演业高质
随着我国海洋经济的高速发展,海洋油气资源开采区域逐渐扩大化,具有高附加值的海洋平台用特厚板市场前景广阔。但现存海洋平台用钢普遍存在合金成本高、工艺复杂和性能不稳定等问题。本文结合国家863计划重大课题“海洋平台用高锰高强韧中厚板及钛钢复合板研究与生产技术开发”课题,以Ti微合金化低碳中锰钢为实验对象,研究Ti元素对中锰钢基体组织和综合力学性能的影响,揭示微合金中锰钢特厚板的强韧化机制,最终获得高强
水质恶化导致水质性饮用水的缺乏,基于催化过程的化学方法是解决水环境污染问题的重要方法,这类方法的重要基石是催化剂。与此同时,化石能源的快速消耗导致全球性能源短缺,迫使人们开发新能源。燃料电池是一类重要的新能源,其基石离不开高效的电催化剂。因此,无论从环境化学的角度还是从能源化学的角度,催化剂是解决可持续发展所需的一类重要物质。碳基材料具有价廉易得的特点,不仅自身具有一定的催化能力,还可以充当优异催
本文应战车轻量化的需要,开发500MPa级模锻部件。采用7085高强铝合金半固态触变模锻,研究半固态制浆方式、二次加热温度和时间、模锻温度、坯料高径比、模具温度及锻后热处理方法对锻件组织和性能的影响,为该产品的工业化生产提供理论和工艺基础。获得的主要结果如下:(1)常规DC铸造的坯料晶粒为枝晶、尺寸较大,加电磁后,晶粒尺寸得到一定程度的细化,晶粒转变为蔷薇状或近球状;液相线铸造坯料的晶粒尺寸比常规
金属层状复合材料是指由同种或异种金属以一定单元层厚度复合而成的复合材料。通过综合各组元金属在物理、化学和力学等方面的优势,金属层状复合材料具有高强度、低成本、应用广等特点。本文采用累积叠轧工艺制备了两种Ti/Zr多层复合板:初始金属Ti和Zr的单层厚度分别为50 μm和初始金属Ti和Zr的单层厚度分别为1 mm,以这两种复合板为研究对象,采用X射线衍射仪(XRD)测定随着叠轧道次增加组元金属的织构
数控设备互联协议作为用于实现不同数控设备间互联互通的协议,是实现工业智能化制造的关键。目前,国外主流的数控设备互联协议有美国的MT-Connect以及欧洲的OPC UA,而国内则有正处于应用测试阶段的NC-Link。为了使得NC-Link能够应用于复杂的工厂环境,本文使用代理技术和集群技术对NC-Link协议服务代理与集群方案进行了设计,为NC-Link系统提供了必要的安全通信保障以及可用性。首先
创新作为2015年党的十八届五中全会提出的“五大发展理念”中的首位理念,在中国城市发展的进程中扮演着核心增长极的地位。创新的发展一直与城市发展相辅相成,城市为创新提供空间载体、创新为城市提供增长动力,且创新具有明显的都市化倾向与集群化特征。因此,若要实现创新要素在城市中的锚定,必须通过土地供给政策,以实现创新集群与土地政策的适配,进而满足创新在城市中的发展。文章基于上述背景,针对创新集群的土地供给
三维建筑物模型是虚拟地理环境中的重要可视化要素,被广泛应用于三维导航,数字城市,灾害防治等领域。随着三维建筑物模型数据生产技术的发展,三维建筑物模型变得越来越真实,细节不断丰富,数据量也急剧增加。海量的三维建筑物模型数据不仅给网络传输带来了沉重负担,也对客户端渲染提出了重大挑战。为此,学者们提出了渐进式传输方法,该方法将模型渐进式编码为基础模型网格和网格增量,在传输时先传输基础模型,再按固定顺序或
计算机视觉和自然语言两个领域近十年来得到长足发展,这两个领域的发展推动了多模态任务的研究。具有代表性的任务之一是2015年学术界提出的具有开放式特性的视觉问答(Visual Question Answering,VQA)任务,该任务将图像和开放式的问题作为输入,并输出自然语言形式的答案[1]。视觉问答模型需要同时对图像的视觉内容和问题的文本内容进行细粒度理解,然而目前大部分VQA模型都只使用视觉注