【摘 要】
:
近年来随着深度学习的发展,人工智能的应用场景已经逐渐贴近我们的生活,城市街道场景、监控场景理解均要求对视频图像具有精确的语义分割,该问题已成为当前研究热点之一。本文通过研究基于深度学习的语义分割方法,提出了一种基于Deep Labv3+改进的语义分割模型,来改善城市街景语义分割精度,并将算法在城市级监控质量评价系统平台进行了尝试。主要的工作内容及创新点如下:(1)解决Cityscapes数据集的数
论文部分内容阅读
近年来随着深度学习的发展,人工智能的应用场景已经逐渐贴近我们的生活,城市街道场景、监控场景理解均要求对视频图像具有精确的语义分割,该问题已成为当前研究热点之一。本文通过研究基于深度学习的语义分割方法,提出了一种基于Deep Labv3+改进的语义分割模型,来改善城市街景语义分割精度,并将算法在城市级监控质量评价系统平台进行了尝试。主要的工作内容及创新点如下:(1)解决Cityscapes数据集的数据不平衡问题。通过调整模型损失函数,达到了优化模型分割精度的目的。本文首先通过为原模型的交叉熵损失函数加权来解决数据集类别数量不平衡问题,经过对比试验后,最终利用focal loss替换交叉熵损失函数,达到同时解决数据集类别数量与训练难度不平衡的目的。实验结果表明加权的focal loss的训练效果优于加权的CE loss,两者较CE loss性能上均所有提升。(2)针对Decoder输入特征做出调整。本文首先将Decoder输入的浅层特征由1个调整为3个,分别是来自Xception_65网络中的entry_flow/block2、entry_flow/block3与exit_flow/block1的深度可分离卷积层输出,随后利用ASFF将三个浅层特征进行自适应融合后再与Encoder输出在通道方向进行concat。实验结果表明使用ASFF融合的特征作为Decoder的输入在一定程度上起到了提高分割精度的作用。(3)加强主干网络的特征提取能力。利用通道注意力机制对主干网络残差结构中的addition过程进行优化,在addition操作前对residual分支使用SE-block进行重新标定,来实现加强主要特征,抑制次要特征的功能。实验结果表明,利用SE-block改进后的主干网络进行特征提取能有效地提高分割精度。综上所述,本文通过利用focal loss作为损失函数、利用ASFF优化解码器结构、使用SEblock结构优化残差结构等方式,使改进后的Deep Labv3+模型在Cityscapes评估集上的miou达到了85.20%,最后,该算法在城市级监控质量评价系统平台项目中进行了尝试,测试效果良好。
其他文献
网络控制系统(Networked Control System,NCS)是由通信网络组成闭环回路的空间分布式控制系统,因兼具强大的灵活性、发展的便捷性和广泛的兼容性,在不同领域的实际控制系统得到了广泛应用。然而,网络作为一种可靠性较低的通信介质,传输过程中多条信号在同一时间段内集中通信,易受到网络攻击及发生拥塞滞碍,严重时造成网络时延、丢包、无法正常运行等一系列问题。因此,NCS通信过程中的资源受
随着时代的发展,以糖尿病为主的慢性病对人们生活的影响愈来愈严重,患病人数居高不下,并发症发生频频。在医疗领域,机器学习技术已在解决医疗难题上崭露头角,可以辅助进行疾病预警、病情分析等,但是在糖尿病防控及并发症治疗方面应用较少,机器学习模型在糖尿病预测及复杂场景下的效果略显不足。基于此,本文将机器学习技术用于糖尿病及其并发症诊治智能服务上,首先基于用户身体数据信息感知用户是否患病;其次在患病基础上实
近年来,深度学习在图像去噪方面取得了显著的进展,得到了国内外研究人员的广泛关注。然而,大部分现有基于深度学习的图像去噪方法依赖于数据驱动,模型参数缺乏可解释性。相比之下,基于模型的传统去噪方法能准确地定义模型,具有较强的可解释性。研究模型和数据联合驱动的深度神经网络能有效集成两类方法的优点,是解决深度神经网络可解释性问题的有效途径。因此,本文以图像去噪为应用背景,利用深度展开思想搭建可解释性深度神
指静脉识别因其显著的优势近年来逐渐成为研究热点。然而,目前指静脉识别系统大多都直接存储指静脉原始模板,一旦攻击者通过一定不法操作攻击了系统的数据库,由于生物特征的特殊性,模板的丢失会对用户造成严重的隐私侵犯。此外,丢失的模板极有可能会被攻击者作为系统仿冒攻击的工具,造成严重的系统安全风险。针对这些安全性的问题,本文对指静脉模板保护和仿冒检测算法进行了研究,并做了如下工作。(1)目前的指静脉模板保护
随着移动通信技术日益发展和进步,移动互联网数据流量呈现井喷式地增长,各类新型应用层出不穷,网络业务也变得愈加复杂。而对网络业务类型进行识别可以有效地预防网络威胁、保障网络安全、实现访问控制、进行内容审计。但是由于网络业务类型日益繁多且数据流量采用加密的方式进行传输,导致单纯地依靠传统的网络业务识别方法已经不能有效且准确地识别出复杂的业务类型,因此需要研究新的业务识别方法。近年来,随着机器学习不断成
光动力治疗具有低侵袭性和高时空选择性等优点,受到研究者们的广泛关注。但是传统的光动力治疗方案存在光敏剂肿瘤富集量和细胞摄取率低、活性氧供应不足等难题,限制了它的进一步应用。本文设计一种柔性中空人血清白蛋白纳米胶囊,并以此为基础提出两种光动力治疗方案。一种是利用柔性结构、人血清白蛋白和过氧化氢酶,解决传统光动力治疗方式中存在的光敏剂细胞摄取率和肿瘤富集量低以及活性氧产量低等问题。另一种则是利用光动力
多输入多输出(Multiple-Input Multiple-Output,MIMO)系统通过在基站端配置大量收发天线,为消除干扰和调度更多用户提供丰富的空间自由度,通过结合预编码从而能够提升系统的频谱效率、增强链路的可靠性。符号级预编码(Symbol Level Precoding,SLP)能够获得优于预编码的性能,得到广泛的关注。利用大规模MIMO可以进一步增加空间自由度,但是大规模天线的引入
随着物联网技术的快速发展和广泛应用,物联网设备呈爆炸式增长。物联网通过万物互联的方式扩充了互联网的概念,实现了万物互通。边缘计算因其有效降低计算系统延迟,减少数据传输,缓解云计算中心压力等优势,已广泛应用于物联网领域。然而,由于边缘环境的开放性及节点间采用无线通信的方式,数据在传输过程中会受到篡改攻击和中间人攻击等,数据在传输过程中的安全问题将会制约边缘计算的发展。现如今,利用区块链技术实现边缘数
对于电极材料来说,多孔结构可以改善材料的性能。比如,其可以增加材料的比表面积,有利于相应的传质过程,促进电解质离子的传输和降低接触电阻,从而提高器件的存储性能。金属有机框架(MOFs)材料由于其自身的多孔结构的特点,在超级电容器领域得到了广泛的研究与应用。但是传统MOFs材料内部都是微孔结构,不利于离子的快速传输,这极大的限制了MOFs材料在电化学领域的应用。目前通过模板作用以及延长配体等方法可有
随着无线通信技术的发展,高速度、高容量、高效率和高安全的通信需求也在不断增长。由于无线信号固有的广播特性,在通信过程中总是面临着各种各样的安全问题。近年来,智能反射面(Reconfigurable Intelligent Surface,RIS)被广泛用于增强无线通信系统中的物理层安全。此外,符号级预编码(Symbol-level Precoding,SLP)因其在利用多用户干扰方面的巨大优势而备