【摘 要】
:
目标检测与跟踪是计算机视觉领域长久以来的研究热点和难点,主要任务是找出图像中所有感兴趣的目标或物体,确定它们的类别和位置,并在一个连续时间序列上,持续不断地跟踪目标或物体的运动状态,从而获得其完整的运动轨迹。目标检测和目标跟踪都属于计算机视觉的核心任务,并因目标外观、形状和姿态的差异,以及运动变化、图像光照、遮挡等因素,成为计算机视觉领域极具挑战性的任务。尽管目前各种目标检测与跟踪算法已在公开数据
论文部分内容阅读
目标检测与跟踪是计算机视觉领域长久以来的研究热点和难点,主要任务是找出图像中所有感兴趣的目标或物体,确定它们的类别和位置,并在一个连续时间序列上,持续不断地跟踪目标或物体的运动状态,从而获得其完整的运动轨迹。目标检测和目标跟踪都属于计算机视觉的核心任务,并因目标外观、形状和姿态的差异,以及运动变化、图像光照、遮挡等因素,成为计算机视觉领域极具挑战性的任务。尽管目前各种目标检测与跟踪算法已在公开数据集上取得了不错的效果,但在实际应用过程中,更加复杂的现实场景,对算法提出了更高的要求。因此,为了提升算法性能,目前主流的方式为加深模型,提高特征提取能力,此举虽带来了一定程度上的精度提升,但算法速度损失明显。本文面向车辆和行人这两个重点研究对象,针对目标检测与跟踪算法精度和速度无法兼顾的核心问题展开研究,致力于获取算法模型精度与速度的平衡。主要工作如下:(1)提出了一种基于YOLO v3目标检测框架的新型轻量化目标检测算法Smart YOLO。该算法脱胎于YOLO v3基本架构,在其基础之上,首先引入了深度可分离卷积与逆残差结构,替换原本的残差块,压缩网络宽度,使检测速度获得显著提升;然后重新设计了模型损失函数,引入CIoU和Focal loss解决了训练过程中的边界框发散以及正负样本不均衡的问题,有效优化了模型训练过程,且基本弥补了主干网络所损失的特征提取能力;最后,在算法训练过程加入部分随机图像增强手段,扩充训练数据,提升算法鲁棒性,一定程度上提升了检测精度。在来自某城市实际复杂场景近4万张图像的数据及上,将Smart YOLO分别与YOLO v3及其改进等4种主流算展开对比。在轻量级算法之中,Smart YOLO速度可达40.37 FPS,同时保证了60.31%的mAP(详见表3-6),在大尺度高清图像上的推理速度具有十分突出的优势。与原版YOLO v3相比,Smart YOLO的mAP获得0.28%的提升,但模型大小仅为其八分之一左右,检测速度取得了近3倍的提升。结果表明,改进后的算法基本解决了YOLO v3参数量多、运行速度慢的问题,更适用于对精度和实时性都要求严格的应用场景。(2)改进Deep SORT目标跟踪算法,实现了对动态车辆和行人两类别、多目标的在线跟踪。原Deep SORT算法仅能实现行人单一类别的跟踪,针对多类别、多目标的实时跟踪任务,本文在其深度模型中,添加车辆外观特征,优化模型训练方式,获得了能够同时对车辆和行人进行跟踪的Deep SORT算法模型。分析模型训练过程及性能评价指标可知,改进后的跟踪深度模型整体训练过程高效、稳定,Rank 1准确率达63.78%,Rank 5准确率达90.98%,在特征提取与匹配方面表现优异。(3)融合改进后的检测与跟踪算法,通过应用系统,实现对动态车辆和行人的在线检测与跟踪。将本文提出的轻量级检测算法Smart YOLO封装成目标检测器,融合到Deep SORT跟踪算法之中,于多个真实场景中对融合算法进行测试,在三个典型应用场景中分析融合算法跟踪效果。同时,设计了一套具有图形化界面的应用系统,嵌入了最优目标提取算法,可直观展示融合算法对任意视频中动态车辆和行人的检测与跟踪效果,并实时完成最优目标图像的捕获。
其他文献
随着信息技术的快速发展,图像信息凭借其生动直观的特点成为日常生活和生产中不可或缺的信息传递载体。当前数据传输的安全性已成为信息科学研究的热点,由于传统的图像加密方法已经很难满足当前信息安全的需求,因此需要提出安全性更高的图像加密算法。混沌系统具有强随机性、初始敏感性等特点,可用于信息加密。相对于耗散混沌,保守混沌的伪随机性更强,并且不存在混沌吸引子,不能被时滞嵌入法重构,有更好的安全性。保守混沌主
近年来,随着社会智能化进程的不断加速,商场、车站等流量密集场所的社会公共安全问题日益凸显。针对此类安全问题,智能视频监控系统在其中发挥了至关重要的作用。为了能在大量的视频数据中快速准确地找到目标行人,减轻监控人员的工作量,行人重识别逐渐成为计算机视觉领域的研究热点。行人重识别是在多个非必要重叠区域的监控摄像头拍摄的视频中,找到与目标行人特征最相似的行人图片并进行排序,通常可以看作图像检索的子任务。
由于能源需求的快速增长和环境污染的日益严重,锂离子电池作为一种高效清洁能源,在电动汽车中得到了广泛应用。锂电池在新能源汽车中作为动力来源需要电池管理系统进行监测与管理,其中荷电状态预测是电池管理系统的主要功能,其以数值手段评价整车的动力剩余状态。本文基于数据建模的思想对荷电状态值进行预测,主要内容包括:1.对电动汽车的电池测试实验进行了研究,分析了多种复杂工况,选取专用的电池测试设备进行测试,为数
近些年来随着科技的发展,无人值守环境下的传感设备及智能可穿戴化设备蓬勃发展。驱动这些设备所需的供能设备,比如电池,难以在不中断这些传感设备工作的情况下进行更换。针对无人值守环境下传感设备和智能可穿戴化设备的持续能源供给问题,基于摩擦电纳米发电原理的能量收集装置成为了能源领域的研究热点。虽然摩擦电纳米发电技术自诞生以来不断发展,但在无人值守环境下,监测结构体在低频周期振动状态下的运动状态仍是一个难题
单晶硅要经过拉伸、沉积、蚀刻、切割、裂片等工艺流程加工成半导体晶粒。在晶粒生产过程中,受化学残留物的存在、生产环境洁净度低、工艺设备老化和人为操作失误等不可控因素影响,产生一些表面缺陷,如表面冗余物、划痕、晶体缺角等。表面缺陷会影响晶粒性能,降低产品质量,因此对含有缺陷的晶粒进行识别是十分必要的。传统人工检测存在诸多弊端,如长时间的高强度工作会产生视觉疲劳导致误判增多;受人为主观因素影响难以形成统
混沌现象在数学、物理学、经济学等众多领域中广泛存在,是现代非线性科学的一个研究热点。目前,不止是混沌理论得到深入地研究,混沌应用也在保密通讯等实际工程中得到了发展。近些年对混沌的研究不再局限于分析其相轨迹、Lyapunov指数、分岔等,研究者提出很多进一步分析混沌现象的方法,这使整个混沌研究更加广泛和丰富。本文结合当今混沌研究的热点及研究中存在的问题,从混沌系统构造、分析,新混沌同步方法提出及混沌
智能阀门在过程控制中发挥着举足轻重的作用,是工业控制领域的重要组成部分。为提高智能阀门性能及安全性,本文以天津奥美自动化系统有限公司的电动执行器为研究对象,利用异步电机矢量控制的方法,开展智能阀门行程优化与过载保护系统研究。本文从异步电机矢量控制理论的研究、硬件系统的构建以及系统软件优化的编程实现三个方面开展研究工作。(1)基于矢量控制中Clark变换和Park变换两种坐标变换方法,遵循按转子磁场
油水两相流广泛的存在于石油开采及储运过程中,如原油开采过程中的井口采出液、产液地层中的油水混合物、油气储运管道中的油水两相流动等。油水两相流的流动状态识别及参数检测具有重要意义。首先,生产过程的管道压降预测,管道设计及维护工作需要准确的对油水两相流的流动状态进行识别,需要明确油水两相流的流型演化及迁移机制,两相流仪表的设计也需要流动状态的清晰解析。另外,油水两相流的流动参数是油田动态生产的重要资料
气液两相流广泛存在于石油、能源、化工等工业领域中。认识气液两相流流型的动力学演化规律对于过程工业具有重要意义。首先,气液两相流控制系统的优化以流动条件为依据,需要清晰认识流型的动力学机制。此外,气液两相流仪表的设计、参数测量模型的建立、管道压降预测、传热及传质特性分析也需要对气液两相流流型的流动特性有清楚的认识。然而,由于气液两相流相间作用复杂,其流型受多种因素影响,导致流型的演化过程复杂多变。流
在工业制造中,大量金属材质零件的尺寸和几何参量需要精密测量,以保证制造精度和质量。但金属表面复杂的反射特性,容易形成图像饱和区和低对比度暗区,条纹调制度下降,信息失真或缺失,无法准确的获取三维数据。因此,本文针对基于白光光源的条纹结构光在金属表面调制效果不显着的问题,利用激光的单色、高亮特性,采用基于频闪投射的精密激光光栅条纹投射到金属表面以获取调制效果较好的条纹图像。并结合基于深度学习的高动态条