【摘 要】
:
随着智慧城市的升级,智慧城管系统朝着智能化和多任务的方向发展,其中违规广告牌检测是智慧城管系统的一项重要研究任务。近年来,随着深度学习和计算机视觉的快速发展,越来越多的基于卷积神经网络的目标检测算法被用于非法广告牌检测,具有较高的检测精度,但是在实际应用中可能有一些问题:一方面,对目标检测要求实时性;另一方面,复杂的卷积神经网络的训练需要高性能机器支持,这些高性能的机器不是每个单位都能提供。为了更
论文部分内容阅读
随着智慧城市的升级,智慧城管系统朝着智能化和多任务的方向发展,其中违规广告牌检测是智慧城管系统的一项重要研究任务。近年来,随着深度学习和计算机视觉的快速发展,越来越多的基于卷积神经网络的目标检测算法被用于非法广告牌检测,具有较高的检测精度,但是在实际应用中可能有一些问题:一方面,对目标检测要求实时性;另一方面,复杂的卷积神经网络的训练需要高性能机器支持,这些高性能的机器不是每个单位都能提供。为了更好满足实际应用中的需求,在保证高精度前提下,加快模型的推理速度和减少模型占用的内存资源是一项有必要的研究。本文对违规摆放广告牌的场景分为两种情况:(1)处于车行道上的广告牌;(2)处于人行道中间位置的广告牌。所以在检测广告牌之前,必须针对广告牌的区域进行划分,才能进一步判定广告牌是否属于违规摆放,本文使用的划分方式是基于卷积神经网络的语义分割算法。本文从解决道路上广告牌违规摆放的问题出发,考虑到智慧城管系统有限的硬件资源条件,结合深度学习技术,提出了一种基于轻量级卷积神经网络的违规广告牌检测算法。本文的主要工作内容如下:(1)由于国内各城市道路状况不一,摄像头的转动视角不同和广告牌的大小形态差异较大,在公开数据集上训练的结果并不能很好地用于特定城市道路情况。所以本文的模型既在公开数据集上训练验证又在智慧城管数据集上训练验证。本文的智慧城管数据集是通过获取国内大量特定城市道路监控图片,进行广告牌的目标检测标注,并从中选取一部分样本用于道路分割标注,所有的标注都由手工完成。(2)本文的轻量级目标检测网络分为三部分:主干网络(Backbone)、网络颈部(Neck)、网络头部(Head),其中Backbone选用轻量级的Shuffle Netv2网络,并在其基础单元中加入本文改进的通道注意力机制,Neck部分使用多尺度特征融合技术,Head部分选用的是YOLOv3单阶段目标检测器。通过实验验证本文设计的目标检测网络模型在智慧城管数据集上的参数量为4.055M,m AP达到66.7%,FPS达到73帧/秒。(3)本文的轻量级语义分割网络采用编码器-解码器结构。为使模型轻量化,编码器模块采用通道分离的思想,同时替换卷积核尺寸大于1×1的标准卷积为深度可分离卷积;为提高模型的精度,编码器模块在基础单元中增加多个分支的残差连接,同时引入密集连接的空洞空间金字塔池化用于融合空间上下文,并且改进空间注意力机制,将其用在解码器模块中,通过实验验证改进的空间注意力机制与原来的空间注意力机制相比,m Io U提高了0.6个百分点。(4)本文违规广告牌检测算法结合目标检测和语义分割算法,首先使用语义分割算法划分道路的区域,然后使用目标检测算法获取广告牌的位置,最后结合这两个算法的结果判断出广告牌是否处于人行道中间或者车行道上,进而来判断此广告牌是否属于违规摆放。本文所研究的算法用于检测出特定城市道路中的违规广告牌,在不过多损失精度的前提下,减少模型参数量和计算量,加快模型推理速度,实现有限计算资源的情况下有效辅助相关工作人员检测出城市道路上的违规广告牌。
其他文献
机器阅读理解是自然语言处理领域中的一个重要研究方向,它要求机器通过阅读文本回答问题。以往的机器阅读理解模型大多专注于单文本检索,这些模型只能根据单个段落回答问题,但是在实际问答场景中往往需要通过对多个段落进行推理才能获取问题的答案。为了解决这个问题,多跳推理问答任务被提出。多跳推理问答是机器阅读理解的子任务,该任务旨在跨多个段落进行推理查找给定问题的答案,具备知识推理的能力。目前已有很多模型在多跳
神经形态视觉传感器是一种模拟生物视网膜的仿生传感器,这种新型的视觉设备由光感受器阵列组成,每个光感受器单元异步产生事件,将场景的光强变化编码为无帧的时空事件流。这种传感器有低冗余、低时延、高时间分辨率、高动态范围等优点。由于事件流与传统图像在数据格式上有本质不同,传统图像处理方法无法直接应用与事件流数据。研究构造适合事件流数据的视觉处理方法,是神经形态视觉的一大研究课题。脉冲神经网络以脉冲传递信息
脉冲神经网络受生物大脑结构与计算模式所启发,基于离散稀疏的脉冲信号实现异步计算模式与信息传递,能够被部署在专用神经形态芯片上以极低功耗运行,具有实现高效智能计算的潜力。然而由于专用神经形态硬件芯片在计算以及存储等方面的资源有限,对于需要被部署在其上的脉冲神经网络算法和模型的数值精度、计算模式都有一定要求。为了降低脉冲神经网络算法和模型在硬件上部署的难度,适应硬件芯片的实时应用场景,本文从脉冲神经网
随着物联网技术的快速发展,无线传感器网络被广泛地应用于生活生产。但由于传统无线传感器网络中的传感器节点通常采用电池供电,有限的电池容量使得节点能量问题已成为影响无线传感器网络生存时间和系统性能的主要瓶颈。近年来,无线能量传输技术的发展为解决无线传感器网络中传感器节点的能量问题提供了新思路。利用无线能量传输技术,研究者们提出了无线可充电传感器网络,即在传统无线传感器网络中引入移动充电装置对传感器节点
肺癌是全球当前最常见的疾病之一,而淋巴结的评估在肺癌诊治中占有重要地位。肿大淋巴结的存在被认为与肺癌淋巴结转移密切相关。医生通常依据CT影像中淋巴结情况和/或侵入性分期方法对患者淋巴结转移做出评估,并根据评估结果选择对应的治疗方案。因此,淋巴结的检出和分期影响到患者病情发展、疾病诊断、治疗方案选取和随访等一系列进程。但是由于医疗资源的缺乏和患者数量的庞大,人工阅片使得医生工作强度大,患者等待时间长
结直肠癌是最常见的消化道恶性肿瘤之一。结直肠息肉是结直肠癌的主要癌前病变,对结直肠息肉的早诊早治能够有效的阻断结直肠癌的发病进程,改善结直肠癌患者的生存预后。结直肠镜诊疗技术是临床实践中结直肠息肉诊断的主要手段。但由于存在多种因素不同程度影响了结直肠镜检查的质量和效果,给结直肠息肉甚至早期结直肠癌的检出带来严峻考验。结直肠癌的确诊以结直肠息肉活检细胞的病理检查为依据。结直肠病理的检查是结直肠癌确诊
近年来,随着计算机技术的不断发展,生物电信号的自动识别任务引起了大量学者进行研究。生物电信号自动识别的主要应用场景便是辅助医生进行诊疗,目的是使得计算机可以自主、高效地对生物电信号所反应出的人体疾病、异常做出判断。但在实际应用中,生物电信号的数据标注任务成为了一项大的难题。由于生物电信号本身不易被常人看懂,需要非常有经验的医学专家花费大量的时间进行标注,这极大的浪费了人力资源与时间资源,使数据集的
随着移动智能手机的普及,手持拍照成为日常生活中非常重要的一部分。然而,传统的相机传感器无法捕获自然场景中的高动态范围(High Dynamic Range,HDR),专业的硬件设备也由于其高昂的价格难以普及。目前主流的高动态范围成像(High Dynamic Range Imaging,HDRI)技术主要是通过软件层面实现,即利用算法将低动态范围(Low Dynamic Range,LDR)图像恢
乳腺癌是最为常见的癌症之一,早期发现并及时治疗可大幅提高患者存活率。因此,对于乳腺癌的早期诊断十分重要。相较于钼靶、CT等方式,超声检测因其安全性、便捷性、灵活性等优势被广泛应用,针对乳腺超声图像的辅助判别模型也逐渐被重视。不同于海量的人脸、自然图像数据,典型、准确且有效的医学图像金标准数据是极其有限的,同时,罕见疾病数据和新发疫情的早期数据亦是极度缺乏的,此类状况都极大地限制了深度学习等强大模型
甲状腺结节是一种常见的临床问题,对其进行临床检查能够判断患者是否患上甲状腺癌,超声是首选的检查方式,但为了进行更准确的诊断,还需要对患者作病理检查,由此生成的病理报告是公认的金标准。由于病理报告直接反应患者情况,知晓患者的病理报告诊断结论,便可推导出其超声图像检测结果为良性还是恶性。而这对于甲状腺超声图像的标注也具有重要意义:基于超声图像的甲状腺结节计算机辅助诊断系统以深度神经网络作为主要的甲状腺