监控视频中的目标精确提取

来源 :东南大学 | 被引量 : 0次 | 上传用户:mqshi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频监控系统作为保障居民人生财产安全的基本工具,已成为社会和谐发展的重要组成部分。应用目标检测和语义分割技术实现监控视频下目标的精确提取在目标重识别和跨场景下的检索等领域都有着迫切的现实需求和重要的研究意义。传统目标检测算法在多尺度的监控视频场景下检测效果不佳,对该场景下的小目标检测存在缺陷。经典分割网络在计算量和参数量上难以满足要求,对多尺度目标分割效果一般。本文基于监控视频下目标多尺度特性,针对性地从主干网络、损失函数和特征融合等方面优化了检测网络,并从轻量化模型和特征上采样两个层次优化了分割算法。从目标的检测到分割,形成了完整的基于监控视频下的目标精确提取系统设计。针对该系统,本文主要完成了以下几个方面的工作:
  首先,在对比分析了经典的特征提取网络后,设计了以EfficientNet为主干网络的单阶段检测算法,并引入focal loss解决了正负样本不平衡问题。为提升算法的召回率,使用聚类算法优化了先验框的生成。实验结果表明基于EfficientNet的算法在监控场景中有着更优异的性能,两个优化策略提升了多尺度场景下算法的检测性能。
  为了进一步提升算法在监控场景下的精度,提升算法对多尺度目标的检测能力。在实验数据集上对多个尺度上先验框的分布进行了实验分析,并设计了基于注意力机制的多尺度特征融合,改进应用了基于IoU的损失函数以提升算法的定位能力。实验结果表明,这三项优化都能够提升算法精度,提升算法对多尺度目标的检测性能。
  最后,使用语义分割算法实现了进一步的精确提取。对比分析了经典的语义分割和实例分割算法,并选择了 UNet 网络。应用了轻量化的模型来提升算法运行效率,并借鉴池化金字塔的思想改进了特征上采样模块,提出了基于多尺度池化的特征上采样模块。实验结果表明模型轻量化后运行效率得到了明显提升,优化后的上采样模块也提升了算法的性能。
其他文献
气体绝缘开关设备(GIS)的SF气体密度在线监测系统可以实现SF气体密度(20℃时的气体等效压力)的实时监测,诊断GIS的运行状态,为GIS的状态维修提供重要的依据,对保证GIS运行的安全可靠性,提高电力系统的自动化水平都有很重要的作用.该论文设计研制的GIS设备SF气体密度在线监测系统由硬件系统和软件系统两部分组成,完成的主要功能是:1)SF气体密度值(20℃时的气体等效压力)数字显示;2)数据
学位
GIS
衍射是电磁波在空间传播过程中的普遍现象,它限制了电磁波能量定向定域传播的能力。准无衍射波束能在一定区域内避免衍射扩展的影响,以实现电磁波的定向定域传播,在无线输能、太赫兹空间波导、近场探测、微波加热医疗、近场保密通信等领域,有着十分重要的应用。但是,目前准无衍射波束天线的研究尚处于起步阶段,存在理论分析尚不完备、评价标准尚待统一、工作频率低、带宽窄、无衍射距离短、波束指向无法调控等问题,准无衍射波
本文采用溶胶—凝胶法制备纳米晶SnO2,采用X射线衍射(XRD)、红外光谱(IR)、透射电镜(TEM)等方法,对制得的材料进行表征。结果表明,准确控制溶液PH值、选取适当的烧结温度,可以制备出晶相单一,结晶度良好的SnO2纳米晶材料。本文重点研究了几种有效的提高SnO2元件稳定性的方法,通过大量实验表明,采用向SnO2粉体材料中添加一定比例的铁酸锶镧可以明显改善元件的长期稳定性,此外硫脲表面修饰对
溶胶-凝胶技术是一种以金属醇盐为原料,在较低的温度条件下进行,经历水解、缩聚、陈化、干燥以及致密化等步骤,由溶胶转变为凝胶,进而烧结制成玻璃、陶瓷以及其它无机材料的工艺方法。本论文的主要工作是光波导用SiO2和掺Sn的SiO2膜的溶胶-凝胶法制各过程,并且对它们的特性进行了测试分析。还研究了Sn:SiO2膜的光敏性,摸索了它在紫外光照射下折射率变化的规律,为紫外写入光波导图形奠定了基础。论文第一部
学位
该文以直观的二值图像作为水印信息,以音频数据为嵌入对象,分别在离散傅立叶变换域、离散余弦变换域、离散小波变换域的系数上嵌入水印,该文的主要研究工作和取得的主要成果如下: (1)论述了音频数字水印算法的研究现状及涉及的相关概念. (2)在离散傅立叶变换域,通过对变换域系数的幅值进行量化来嵌入水印信息,给出了量化方案和修改幅度应满足的条件;在水印的提取过程中不需要原始音频信号的参与.采用扩频技术后,能
学位
该论文首先介绍了销售管理系统的应用背景及在整个ERP系统实现中的地位.通过对系统框架的分析及对当前的流行的应用体系结构的分析,提出该模型的三层B/S应用体系结构.并探讨分析一种先进的系统分析和设计建模的方法--基于三层B/S体系结构的面向对象的系统分析和设计方法(OOAD)与标准统一建模语言(UML),给出了一种基于销售管理系统的面向对象模型同时采用标准统一建模语言来描述该模型,包括用例图、顺序图
随着现在技术的发展,互联网的普及,网络数据呈现出爆炸式增长,数字化的生活与人们息息相关。其中大规模的建筑物匹配通常被看作大规模的图像检索问题,可以用于导航技术,地标识别等。本文的研究目标是在海量的图像数据中,快速并正确地搜索出目标图像,从而提高图像检索的准确率和效率。本文对图像特征学习和检索算法进行了深入研究,主要的研究工作包括:  提出了一种基于深度学习网络的特征检测算法,在残差网络的基础上,使
学位
近年来,无人机技术发展迅速,在各行各业都有广泛应用,而为了应对规模较大、复杂的任务场景并获得额外的系统性能增益,需要多智能体协同完成。本课题主要研究了未知流场中一阶多智能体球面编队跟踪控制问题,提出了一种基于自适应神经网络的未知流场估计及鲁棒球面编队跟踪控制器设计;对低空前向视角下公路车道线检测问题进行深入分析,提出了一种新颖的基于深度学习的车道线分割网络;针对车道线数量不确定的场景,设计了一种卷
学位
近年来,生物识别技术在生活、金融、法律、刑侦等应用场景中的需求越来越高,而人脸识别技术以其特征信息丰富、便于采集和高精度等优点成为最受欢迎的生物识别技术。实际应用场景中的人脸识别系统多为小样本问题,即人脸数据库中的每个人脸类别仅能采集到少数样本,我们统称这一类问题为小样本人脸识别问题(FFR)。通常,人脸图像的采集是建立在非可控自然条件之下,往往带有光照、表情、姿态、遮挡等多种变化,因此,复杂变化
学位
无线传感器网络(WSN)由大量协作的无线传感器节点互连而成,在环境监测、智能家居、智能交通等领域得到了广泛的应用。分布式估计是无线传感器网络中的一个重要问题。基于最小均方误差的最优估计算法,如Kalman滤波和信息滤波,通常用于WSN状态估计,以获得准确的估计值。然而,由于无线传感器网络的无线通信特性,攻击者可以很容易地监听网络任务域中的信道,向信道中注入比特流,实施DoS攻击等。深入研究传感器网
学位