【摘 要】
:
目标检测是研究计算机视觉的一个重要基础,也是当代社会中做各种视觉任务的基石。近年来,在深度学习飞速发展的背景之下,目标检测已经达到了前所未有的突破。如今,在辅助驾驶、智能安防、自动控制以及医学智能辅助等领域已普遍应用目标检测。但是,目前的方法处理小目标问题仍然很棘手。真实世界中杂乱多变的使用场合下,小目标伴随着目标光照和遮挡等剧烈变化的情况,通常比较复杂且难以观察。因此,对小目标的检测非常困难。基
论文部分内容阅读
目标检测是研究计算机视觉的一个重要基础,也是当代社会中做各种视觉任务的基石。近年来,在深度学习飞速发展的背景之下,目标检测已经达到了前所未有的突破。如今,在辅助驾驶、智能安防、自动控制以及医学智能辅助等领域已普遍应用目标检测。但是,目前的方法处理小目标问题仍然很棘手。真实世界中杂乱多变的使用场合下,小目标伴随着目标光照和遮挡等剧烈变化的情况,通常比较复杂且难以观察。因此,对小目标的检测非常困难。基于深度学习,本课题对难度系数较大的小目标检测进行深入研究,以Faster R-CNN目标检测算法为基础,优化其网络结构,对数据进行预处理,成功提升了模型对小目标的检测能力。主要研究内容如下:1.针对Faster R-CNN网络无法高效检测到小目标物体,且检测精度较低的问题。提出对Faster R-CNN网络提取到的特征图使用相邻特征融合的方法。该方法将特征图上的深层语义信息和浅层特征使用Element-sum和Concatenation的方式进行合并,使得网络模型对小目标的检测能力有所提高。同时,为了更好地检测小目标,使用过采样对数据进行预处理,并调整Faster R-CNN模型的相应超参数值。从一系列实验结果可以看出,特征融合后的模型较原始Faster R-CNN模型对小目标的检测精度提高了 10.7个百分点,对小目标物体Bottle、Plant、Cow、Boat的检测精度分别提高了 13.9、11.2、6.7和9.5个百分点。与当下最先进的目标检测算法进行对比,本文提出的模型的检测精度mAP得到了显著提高。2.针对小目标检测中存在小目标部分遮挡的问题。对Faster R-CNN目标检测算法进行了如下改进:首先,调整了 RPN网络中anchor的大小,较小尺寸的anchor可以更好的检测到小目标;然后,使用Soft-NMS替代Faster R-CNN中原先使用的NMS,以更好地抑制边界框的重叠;最后,优化Faster R-CNN网络中原始的RoI pooling,优化后称之为PORoI pooling,提高了改进的Faster R-CNN算法对遮挡小目标的检测性能。实验结果表明,该方法对遮挡小目标的检测性能良好。
其他文献
基于深度学习的超分辨率算法(super resolution,SR)通过自适应的学习从低分辨率(low resolution,LR)图像到高分辨率(high resolution,HR)图像的非线性映射拟合SR映射。相比于传统算法在效率、泛化性等方面表现突出。现有基于卷积神经网络的单图像超分辨率(super resolution,SR)模型存在三个限制。首先,一幅LR图像其对应的HR图像的数量在理
水电作为一种清洁能源受到各个国家的重视,我国也不断加大了对水电资源的开发。灯泡贯流式水轮发电机组(Bulb Tubular Turbine Generator Unit,BTTGU)具有转化效率高、尺寸小、重量轻等优点,是开发水电资源的理想机型。机组能否安全稳定地运行决定输出电能的质量,因此掌握其运行规律、提高控制性能具有重要现实意义。本文以BTTGU调节系统为研究对象进行建模,并采用改进型引力搜
作为测绘地理信息工作实现“两支撑、一提升”定位的服务载体、自然资源管理的统一底板、智慧城市的时空基础设施、数字孪生城市的空间数字底盘等,时空大数据平台已成为城市信息化建设不可或缺的内容。时空大数据平台服务领域不断扩大,对其在时空大数据汇聚、融合、管理、共享、分析,以及高可用、高并发、高弹性等方面的要求也不断提升。本文基于云原生平台架构,建立基于微服务和容器的平台服务体系,实现平台服务的稳定、高效与
约束多目标优化问题不仅需要优化多个冲突的目标函数,而且还伴随着各种各样约束条件的限制。进化算法可以有效求解多目标优化问题,但由于约束条件的存在,进化算法需要结合约束处理技术来求解约束多目标优化问题。当约束条件的数量较多、非线性较强或存在等式约束时,可行域变得狭小,现有算法在求解此类问题时处理等式约束能力不足,无法有效利用不可行解信息,不能平衡目标函数和约束条件,不能兼顾收敛性、多样性和可行性。因此
为防止架空乘人装置断绳事故的发生,设计了一种新型断绳抓捕器。使用ANSYA软件对新型断绳抓捕器进行静力学分析,使用ADAMS进行动力学仿真。搭建了试验台,通过实验得出断绳抓捕器的抓捕距离1.2~1.6 m,远小于安全距离3 m,该断绳抓捕器具有较好的断绳保护效果。
随着大数据和高性能计算机的飞速发展,深度卷积网络已在智能交通、智能医疗等重要领域取得突破性进展。但为了提升网络的性能,深度卷积网络的结构复杂度和模型尺寸不断上升,这严重阻碍了深度网络在嵌入式等边缘设备的部署。因此,关于深度卷积网络模型压缩方法的研究得到广泛关注,并成为深度学习领域的重点研究内容。根据是否需要构建预训练模型,现有深度卷积网络模型压缩框架可划分为有预训练模型与无预训练模型的压缩框架。其
目的 探讨耳后注射甲泼尼龙琥珀酸钠联合复方甘草酸苷对突发性耳聋患者的疗效。方法 选取2019年5月至2022年12月收治的突发性耳聋患者116例,采用随机信封法平均分为对照组和治疗组各58例,对照组采用耳后注射甲泼尼龙琥珀酸钠,治疗组在对照组基础上增加复方甘草酸苷,均治疗2周。比较两组疗效、血液流变学指标变化以及炎症因子水平等。结果 治疗2周后,治疗组患者治疗有效率(94.83%)明显高于对照组(
随着科学技术的发展,数字图像越来越在人类的生活中占据重要的地位。然而,数字图像在采集、传输等过程中容易受到诸多自然或非自然因素的影响导致图像受损,而当人类透过玻璃或窗户等透明介质拍照时得到的图像也往往含有反射影像,这使得图像质量受到严重影响。尽管伴随着深度学习技术的崛起,图像修复技术得到了巨大的提升,然而在具有挑战性的任务中,如缺损图像修复和反射图像修复,当前方法修复的结果仍然存在不足。本文深入分
随着互联网的快速进步与发展,信息过载和信息冗余问题日渐突出。无数研究者寻求解决方法,推荐系统成为解决此类问题最有效的途径之一。推荐系统中最经典的算法就是协同过滤算法,但它面临的挑战是如何学习到更有效的用户和项目向量表示来增强算法的预测性能。神经网络的非线性特性可以更好地捕捉用户和物品之间的特征交互,为解决这一问题提供了方法。图神经网络处理非欧几里得数据的能力可以更有效解决问题,所以结合了图神经网络
高原鼠兔目标检测是统计高原鼠兔种群数量和研究其种群动态变化的基础。自然场景图像下的高原鼠兔目标体型小、特征不显著及背景复杂,使其可用检测特征少,而基于深度卷积神经网络的目标检测模型在提取特征时经过多次池化操作,使得高原鼠兔的特征更加难以有效提取,从而对其检测不利;此外,基于深度卷积神经网络的目标检测模型需要大量的样本训练,而高原鼠兔栖息地环境恶劣,且对外界环境变化敏感,采集图像困难,使得高原鼠兔训