【摘 要】
:
目标检测是计算机视觉方向的研究热点之一。目标检测的目的是检测出图像中所有实例的类别,并用一个轴对齐的矩形框大致给出实例的位置。检测器应当能够识别出所有实例,并画出包围实例的边框。它通常被视为一个监督学习问题,广泛应用于工业检测等诸多领域。通过自动检测减少人力的投入,现实意义重大。作为核心和基础性算法,目标检测任务仍然具有挑战性。近年来,虽然目标检测技术一直在不断更新,但由于在实际日常检测任务中图片
论文部分内容阅读
目标检测是计算机视觉方向的研究热点之一。目标检测的目的是检测出图像中所有实例的类别,并用一个轴对齐的矩形框大致给出实例的位置。检测器应当能够识别出所有实例,并画出包围实例的边框。它通常被视为一个监督学习问题,广泛应用于工业检测等诸多领域。通过自动检测减少人力的投入,现实意义重大。作为核心和基础性算法,目标检测任务仍然具有挑战性。近年来,虽然目标检测技术一直在不断更新,但由于在实际日常检测任务中图片或视频中的目标常常形状各异,甚至出现物体之间相互遮挡的情况,还有拍摄设备的分辨率等问题,都会导致检测结果受到各种影响。综上分析,本课题通过分析现阶段目标检测任务中显现的不足之处,提出将YOLOv3和YOLOv3-SPP中的定位损失修改为GIoU损失和基于通道域和混合域的注意力机制的改进算法来提高检测准确率。并提出剪枝算法来解决深度学习模型冗余的问题。利用通道域注意力机制SENet模块和混合域注意力机制CBAM模块解决检测准确率不高的问题。对于重要特征图及非重要特征图的处理,使用SENet来进行针对性地强化和弱化,利用全局平均池化操作来提取全局感受野。使用CBAM模块对输入特征图依次在空间维度和通道维度进行注意力权重的推理。使用剪枝算法力图删除对输出预测几乎无用的神经元,实现更紧凑的模型表示。使用不同的策略在Oxford Hand、PASCAl VOC2012和Vis Drone2019数据集上进行了对比试验。相对于原网络,修改定位损失为GIoU损失函数和注意力机制模块的加入使得网络检测准确率得到提高;相比于未剪枝时,剪枝操作有效减少了模型的参数量和体积,推理速度更快。
其他文献
随着现代社会不断发展,手机、电脑等电子设备已经成为人们日常生活中不可或缺的一部分,同时摄像头等设备在大街小巷发挥着重要作用。超市中,摄像头可以实时记录突发情况;教室中,摄像头可以实时的记录学生的行为活动。监控摄像头中含有大量信息,通过监控视频分析人体行为异常信息已逐渐成为了各个领域的热门话题。人体异常行为检测的研究对于室内场景下分析人体行为提供了有利条件,逐渐成为了一个重要的研究课题。所谓人体异常
眼底图像中的视网膜血管是人体重要的反射区,可以根据视网膜血管的病变程度,了解其他部位的疾病。随着深度学习人工智能技术的发展,计算机技术辅助医疗疾病的诊断已成为一种趋势。本文对图像分割以及视网膜血管分割的国内外现状进行了深入的总结,介绍了深度学习视网膜血管分割相关的理论知识。目前视网膜血管分割方法还存着分割准确率不高、灵敏度较差、错误识别分割区域等问题。针对这些问题,运用深度学习方法,对视网膜血管进
水声传感器网络(Underwater acoustic sensor network,UASN)作为水下物联网感知层的重要组成部分,在海洋工程监测、开发海洋资源、预防自然灾害等多个领域具有广阔的应用前景。UASN在实际应用中需要部署大量节点,并且需要节点间高效的信息交互,协同完成具体任务。因此面向UASN的分簇、路由技术成为学术界研究的热点。水声信道长时延、窄带宽、高误码率等特点,使得传统的传感器
装配序列规划是机械产品装配工作中的基础环节,亦是决定装配质量的重要环节,装配序列的合理规划直接影响装配的效率和成本消耗,因此如何使装配序列规划过程更加精确与高效成为了现在制造业研究的重要问题。智能优化算法的应用为具有约束条件限制的装配序列规划问题提供了一种高效的路径寻优方法,装配仿真技术为验证装配序列的准确性提供了保障。本文以机翼为研究对象,提出了利用蚁群遗传混合算法对机翼装配序列进行优化的方法,
随着无人机及其相关技术的快速发展与日渐成熟,其在军事、商业、民用等领域正扮演者越来越重要的角色。在无人机的实际应用中,往往需要众多无人机之间互相通信、相互协作共同完成复杂的任务。因此面向无人机组网的路由技术越来越受到重视,并成为当下研究的热点。由于完成任务的复杂性、网络拓扑的高动态性、无人机节点容易受到外部损伤等特点,,研究无人机组网下的拓扑、路由技术来提高数据传输的可靠性、网络抗毁性具有十分重要
在日常生活中,网络购物是一种重要的购物方式,但是网络购物看不到真实的商品,用户只能通过阅读为产品编写的在线评论,以决定是否购买该产品。评论实际上影响着用户的购买决策,关联着商家的销售额,往往正面积极的评论对提高销售额是更有帮助的。因此,为了获得利益,一些商家开始雇佣水军,制造虚假评论,这些评论无关商品优劣,并不是用户对待商品真实的想法,严重影响了用户的网络购物体验。为了检测这类虚假评论,研究者已从
随着社会经济的不断发展,城市人口和机动车保有量也在持续增加,从而导致交通拥堵成为阻碍城市发展的主要问题之一。为了解决该问题,作为智能交通系统重要组成部分的短时交通流预测技术得以快速发展。但是由于交通轨迹数据的数据规模大、时空依赖性强以及易受外界环境因素影响等原因,导致短时交通流预测的准确率很难得到保证。虽然目前已有许多用于处理轨迹数据并且实现短时交通流预测的研究方法,但是这些方法大多是以交通流数据
随着传感器和遥感技术的不断发展,遥感图像的空间分辨率和光谱分辨率随之得到了很大的提升。光-谱双分辨率的提高,使得遥感图像的数据量成倍增加,导致了一些原有处理遥感图像分类的方法、手段、工具出现了应对不良的情况。而深度学习的出现,很好地解决了上述问题。虽然深度学习相关分类算法有高精度的优势,但是在算法的训练过程中,需要对应的标签。这就意味着,需要耗费大量的人工成本,这也一直是遥感图像分类过程中的一大难
目标检测是通过提取像素点组成的信息来判断场景中物体的类别与位置,该技术广泛应用于航空航天、工业检测、无人驾驶、智能视频监控以及日常生产生活中的诸多领域,通过计算机视觉减少对人力资本的消耗具有重要的现实意义。随着深度学习、计算机硬件(GPU)的发展以及大规模图像数据集的出现致使目标检测算法也得到了快速地发展。目前深度学习的的目标检测方法主要有两类:基于候选区域的目标检测算法和基于回归的目标检测算法。
近年来,我国人民生活水平飞速提高,无论是工作还是闲暇时间,人们的聚集活动越来越多,例如大型会议、文化活动、演唱会、体育赛事等等。这些场所通常缺少精准的人群计数功能和高密度人群预警功能,导致安保人员无法及时准确地发现高密度人群聚集点。这就容易引发灾难性的踩踏事件,给人民群众的人身安全带来了极大的隐患。传统的监控依赖安保人员肉眼去观察人群密度,很难准确及时发现问题。而机器视觉的发展为协助安保人员及时发