【摘 要】
:
人工智能正逐步成为新一轮科技革命的核心驱动力量,目标检测作为人工智能领域的重要研究内容之一,其检测性能会直接影响到后续进一步的处理任务,如目标追踪、姿态识别、自动驾驶等。基于深度神经网络的目标检测算法可以自动提取图像中的多种目标特征,并快速精确地对目标进行定位和识别,是目前目标检测领域主流的研究方向。但是由于图像拍摄的角度、距离、复杂场景以及光照强弱等影响,图像中难免会出现小目标和遮挡目标,而小目
【基金项目】
:
国家自然科学基金项目(编号:U1704130); 河南省科技攻关项目(编号:212102210151); 开封市科技攻关项目(编号:2101006);
论文部分内容阅读
人工智能正逐步成为新一轮科技革命的核心驱动力量,目标检测作为人工智能领域的重要研究内容之一,其检测性能会直接影响到后续进一步的处理任务,如目标追踪、姿态识别、自动驾驶等。基于深度神经网络的目标检测算法可以自动提取图像中的多种目标特征,并快速精确地对目标进行定位和识别,是目前目标检测领域主流的研究方向。但是由于图像拍摄的角度、距离、复杂场景以及光照强弱等影响,图像中难免会出现小目标和遮挡目标,而小目标和遮挡目标的有效像素少、携带的特征少、特征不明显,且很大程度地被淹没在噪声和背景杂波中,导致有效特征难以提取,容易造成误检、漏检和重复检测的问题,从而影响目标检测模型的性能。此外,随着网络层数的加深易造成目标特征丢失,因此,小目标和遮挡目标检测是目标检测领域面临的最具有挑战的问题之一。针对上述问题,本文展开了基于深度回归神经网络的小目标和遮挡目标检测算法研究,提出了小目标和遮挡目标检测方法YOLO-ACN,并在此研究基础上进一步针对红外图像目标检测领域中的小目标和背景遮挡问题提出YOLO-FIRI检测模型,实验结果表明所提出的方法能够有效提升小目标和遮挡目标的检测。主要内容和创新如下:(1)针对自然图像中小目标和遮挡目标检测性能较差的问题,提出了新的基于深度回归神经网络的小目标和遮挡目标检测算法YOLO-ACN(Attention、CIo U、NMS)。网络设计过程中,引入了两个维度的注意力机制以实现对小目标和遮挡目标的关注,并采用CIo U计算边界框损失,进一步利用CIo U的值作为后处理阶段的阈值设定进行边界框筛选,避免发生小目标和遮挡目标检测框被过滤的问题。(2)针对红外图像目标距离远、能量弱、分辨率低导致的检测精度低的问题,进一步提出YOLO-FIRI(For Infrared Images)小目标和遮挡目标检测算法。针对特征难以进行有效提取的问题,在特征提取网络设计时通过拓展和迭代浅层骨干网络中的CSP(Cross Stage Path)模块,同时引入改进的卷积核注意力机制SKNet(Select Kernel Networks)来增强对小尺度目标的关注。此外,还通过改进多尺度检测层设计,增加对浅层高分辨率特征图的检测,提升检测阶段对小目标和遮挡目标的敏感度。(3)针对红外图像分辨率低、背景干扰大的问题,利用基于深度神经网络的图像融合预处理方法,融合红外图像和可见光图像,从而改善图像质量,减少冗余信息,增强特征信息。在实现红外图像的数据增强的同时,进一步提高模型的特征提取能力和检测性能。最后,本文分别在自然图像数据集MS COCO和VOC以及红外图像数据集KAIST和FLIR上对改进的两个网络模型进行实验和分析。对于所提出的YOLO-ACN检测算法,在MS COCO上的实验结果表明,与YOLOv3相比,小目标的平均精度APs提升了1.0%,速度提升了7 ms,平均精度(m AP50)达到53.8%,比YOLOv4提升了1.2%。对于所提出的YOLO-FIRI检测算法,在KAIST红外图像数据集上的m AP50达到了98.3%,实时速度为14 ms。在people类别的检测上,平均精度甚至达到了99.0%;在FLIR红外图像数据集上的m AP50为83.5%,相比于YOLOv5s模型,本文所改进的模型在两个不同红外数据集上的目标检测平均精度分别高出5.2%和3.4%,而且YOLOFIRI权重文件大小仅有15.0 MB,适用于嵌入式设备的应用。综上所述,针对基于回归神经网络所提出的目标检测算法在保持单阶段目标检测实时检测速度的同时,更加关注小目标和遮挡目标检测。
其他文献
癌症是威胁人类生命健康的严重疾病之一,传统的癌症治疗方法包括手术治疗、化疗、放疗等。这些治疗方式存在创伤大、毒副作用大等问题,因此,寻求针对癌症新的有效治疗手段是近年来的研究热点。免疫治疗、基因治疗、光热治疗、光动力治疗以及上述几种疗法的联合疗法是近年来新兴的癌症治疗手段。其中,光热疗法的基本原理是利用光热转换剂在合适波长光源激发下产生热量,使局部温度升高到一定阈值后,可导致肿瘤细胞的损伤和死亡。
随着世界各国对教育的不断推进和改革,越来越多的国家重视对学生科学探究能力的培养。科学探究不仅是学生学习物理的主要方式之一,也是一种综合的、关键的能力和素养。论证探究式教学(Argument Driven Inquiry,简称ADI)是一种将科学论证与科学探究相结合的教学模式,它以论证来驱动整个科学探究过程,学生在此过程中经历设计实验方案、收集数据、展开论证、撰写研究报告等八个环节,相关研究表明该模
三维(3D)钙钛矿太阳能电池在过去十几年的发展过程中,效率从3.8%上升到如今的25.7%,可见其巨大的发展前景。然而,稳定性一直阻碍着三维钙钛矿太阳能电池商业化的发展。准二维Ruddlesden–Popper(2D-RP)钙钛矿由于其优异的稳定性受到了科研人员的广泛关注。然而,2D-RP钙钛矿太阳能电池的效率同3D钙钛矿太阳能电池的效率相比仍相差较远,其中一个主要原因是制备高质量的2D-RP钙钛
在团簇尺度下,掺杂金团簇呈现出许多与金块体不同的物理化学性质,使得其在材料科学、传感器件、生物技术、医学、催化等领域均具有广阔的应用前景,金-碳族元素掺杂团簇的理论研究对实验制备此类团簇具有重要实际意义。此前的研究结果表明AuSi4中具有与硅氢化合物同样强的共价键;Au2Si6具有显著的三维芳香性,并具有σ+π双键特性;金-炔基单元的催化剂中Au-C键的强度和键级之间成反比关系,显示出金-碳族元素
显示技术是现代社会的文明之窗、智慧之窗,而薄膜晶体管(Thin-Film Transistors,TFTs)则被誉为现代显示技术的“粮食”。TFTs作为显示器像素的有源开关和驱动的核心组成部件,广泛应用于有源矩阵液晶显示器(AMLCD)和有源矩阵有机发光二极管显示器(AMOLED)等平板显示器,而TFTs的迁移率和稳定性是决定显示技术面向产业化的关键问题。随着现代工业化的发展,人们对高分辨率、高帧
随着工业化水平的不断发展,传统能源储备量的下降和环境污染的加剧成为全球可持续发展的两个主要障碍。而半导体光催化技术在治理环境污染与生产清洁能源等方面的出色表现被认为是解决这一难题的重要方案之一。研究表明,优秀的光催化剂应该具备以下几点:高效的光吸收效率、光生电子空穴对的分离效率以及转换效率等等。大量的研究表明,单一组分的半导体很难同时达到以上几点的要求,于是,多元复合光催化剂成为科学界的研究热点。
目前,石油、煤炭、天然气等化石能源日益枯竭,且伴随着化石能源的燃烧带来了严重的环境污染以及能源的浪费问题,一直困扰着人类。开发热电材料为解决环境污染以及能源的浪费提供了一种新的方法。热电材料能直接将废热转化为电能,而受到了越来越多的关注。一方面热电材料可制备成可穿戴柔性热电器件,它们工作在300-500 K的温度范围内;另一方面热电材料可制备成热电发电机,工作在500-700 K温度范围内,有效的
随着超快光学的快速发展,超快非线性光学材料已然成为非线性光学领域的一个重要发展方向。石墨烯作为一种性能优异的二维材料,不仅具有宽波段响应,高透射率等线性光学特性,也表现出诸多特殊的非线性光学性质,如可饱和吸收、光克尔、光热效应等。然而,超薄的结构属性也抑制了石墨烯薄膜的非线性光学效应,限制了其实际应用。石墨烯表面的功能化能够为石墨烯引入新的光学增强效应,拓展其非线性光学应用。因此,本论文以功能化石
有机-无机杂化铅卤钙钛矿由于其具有直接带隙、高光吸收系数、长载流子扩散长度、高载流子迁移率等优异的物理性能被视为新一代光伏器件光吸收层的候选材料,并已成功应用于各种光电器件,然而铅的毒性却极大地阻碍了其广泛应用,因此有必要开发无铅钙钛矿材料以生产环境友好型钙钛矿器件,其中卤化锡钙钛矿是实现高性能无铅钙钛矿光电器件的主要途径。与铅基钙钛矿相比,锡基钙钛矿具有更小的带隙、更低的激子结合能和更高的载流子
随着科学技术的发展,世界信息产业迈入物联网(Io T)和人工智能时代,电子设备逐渐趋于多功能化、智能化、小型化和便携化。由大量传感器单元构成的网络衔接是构建物联网的基础,而如何为数量庞大的微型电子设备供电已成为阻碍电子信息技术进一步发展的关键问题。然而,使用传统的化学电池作为能量供应装置不仅会带来严重的环境污染,而且面临着回收和管理的难题,因此发展新型可持续的绿色能源已迫在眉睫。摩擦起电是自然界和