基于深度学习的视频多目标跟踪技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:goooooooal
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频多目标跟踪的主要任务是定位视频帧中所有感兴趣的目标,在不同帧间维持目标的身份并生成目标的运动轨迹。视频多目标跟踪是计算机视觉中的一个重要问题,在诸如智能武器装备、视频监控、自动驾驶、人机交互等领域具有重要的应用价值。近年来,以卷积神经网络、递归神经网络为代表的深度学习技术在计算机视觉领域取得极大成功,基于深度学习的目标检测技术也获得了巨大突破,基于检测的跟踪(tracking-by-detection)范式成为多目标跟踪方法的主流。复杂的视觉场景中目标数量众多且动态变化、目标之间相互遮挡、目标的外观相似、检测器出现检测错误等问题,给多目标跟踪带来极大挑战。本文针对基于检测的跟踪范式,研究如何构建鲁棒的亲和力度量,提高多目标跟踪算法的准确率。为了使算法在有实时性要求的场景中取得较好的跟踪性能,本文分别研究了半在线处理方式和在线处理方式。为进一步提高目标表示的精确性,本文还研究了多目标跟踪和分割问题。具体来说,为了增强在线算法中传统的相似度度量的鲁棒性,提出基于序列–到–序列相似度度量的半在线多目标跟踪算法,并进一步基于目标在一段时间内的外观一致性,提出结合多种一致性外观线索的半在线多目标跟踪算法;为了利用检测–检测对构成的潜在关联之间的交互关系,如相容关系、互斥关系,提出基于检测对的端到端图卷积神经网络用于在线多目标跟踪;为解决现有多目标跟踪算法使用边界框(bounding box)表示目标过于粗糙的问题,提出一种多目标跟踪与分割的在线方法。本文的创新点主要包括:1.基于序列–到–序列相似度度量的半在线多目标跟踪模型。提出的序列–到–序列相似度度量学习已跟踪目标轨迹序列与假设检测序列之间的相似度,其中已跟踪目标轨迹序列由已经被关联的检测响应构成,假设检测序列由邻近未来帧中的检测响应构成。基于这样的思想:如果一个已跟踪目标轨迹序列和一个假设检测序列具有较高的相似度,并且该假设检测序列和当前帧中某个检测响应具有较高的相似度,则该已跟踪目标轨迹序列和该检测响应的相似度也较高。通过将一小段假设检测序列作为“桥”,本文提出的序列–到–序列相似度度量增强了传统的已跟踪目标轨迹与当前检测响应之间的相似度度量,提升了其对于目标遮挡与丢失的鲁棒性。2.结合多种一致性外观线索的半在线多目标跟踪模型。为了区分来自不同目标的检测,同时将来自同一目标的检测聚在一起,基于目标在一段时间内的一致性外观,本文利用分别来自现在、过去和未来的三种类型的证据进行相似度估计。检测–到–检测相似度度量聚焦于现在的外观信息,序列–到–检测相似度度量聚焦于过去的外观信息,序列–到–序列相似度度量聚焦于未来的外观信息。三种度量通过学习到的自适应结合权重融合起来,得到一个综合性的度量。3.基于将检测对做为顶点的端到端图卷积神经网络的在线多目标跟踪模型。图神经网络已被证明可以为建模检测之间的交互提供一种自然的方式。受此启发,本文提出了一种基于深度图卷积关联网络的新颖的数据关联方法,将检测级交互扩展到关联级。通过将由检测对构成的潜在关联视为图的顶点,显式地建模潜在关联之间的交互。潜在关联之间的兼容交互和互斥交互信息通过相应的边进行建模。通过重新定义图的顶点和边,本文提出的模型能够从外观特征和运动特征融合足够的交互信息,并以端到端的方式学习一个强有力的相似度度量。4.无需边界框的联合跟踪与分割的在线多目标跟踪与分割模型。通过添加一个实例分割分支,本文扩展当前最先进的联合检测与跟踪模型FairMOT,提出一个在线的多目标跟踪与分割方法FairMOTS。FairMOTS以视频的原始图像帧为输入,通过一个卷积神经网络同时解决实例分割和多目标跟踪问题,并直接生成目标掩膜轨迹。FairMOTS包含三个同质分支,分别预测像素级目标度得分,目标掩膜,以及重识别特征。不同于先前依赖于目标的边界框进行实例分割的联合多目标跟踪与分割方法,FairMOTS不依赖于目标的边界框,可以直接估计目标的掩膜。
其他文献
目的:观察补肺定喘汤治疗支气管哮喘慢性持续期的临床疗效。方法:将72例支气管哮喘慢性持续期患者随机分为对照组和治疗组各36例,对照组给予支气管哮喘慢性持续期的常规西药治疗;治疗组在对照组的治疗基础上加用补肺定喘汤。疗程为4周,治疗结束后观察两组疗效、各主要证候积分、肺功能改善情况及6 min步行距离。结果:治疗4周后,治疗组总有效率(94.44%)明显优于对照组(72.22%),P<0.05。两组
针对目前市场上播种机播种功能单一、间距调节困难等问题,设计了一款间距可调式8挡变速器多功能播种机。首先,在选择合理传动方案基础上,进行株距可调式变速器传动机构设计计算,结合株距可调式变速器输入轴的转速,计算出该变速箱的所有传动比、各齿轮模数及各齿轮齿数,进而完成轴上零件的设计;其次,采用三维建模、运动学分析和有限元分析等方法,构建变速器三维模型,计算得出齿轮产生的最大等效应力为54.484 MPa
报纸
<正>“空喊口号”“不推不动”“急功近利”“躺平”等典型作风问题,是脱离群众的突出表现,对我们的事业有百害而无一益。因此,作风革命若想见效,就必须脚踏实地地开展,不能搞一阵风式的运动,不能搞以文件落实文件、会议落实会议的形式主义,
期刊
有限空间是指通风不良、容易产生或者聚集有毒有害气体、可燃气体的封闭、半封闭空间。在有限空间内作业极易产生缺氧、窒息、中毒等人身伤亡事故。火力发电企业有限空间设备设施密集,有限空间相关作业频率高,作业风险问题突出。本文主要对火力发电企业有限空间进行辨识,对可能存在危险源进行分析,对作业施工进行指导。
山东省马铃薯的种植面积比较大,也为马铃薯种植户带来了较为可观的经济收入。山东省位于中国东部沿海,属于暖温带季风气候,光照资源充足,具有较为丰富的自然资源。基于这样的环境条件之下,使用高效种植技术,有助于实现马铃薯的高质、高产。鉴于此,本文主要探究山东省马铃薯高产高效种植技术的具体应用,由此为相关人员提供参考。
本文旨在筛选干扰素(IFN)治疗应答不同的慢性乙型肝炎(CHB)患者间IFN通路的差异表达基因,明确IFN疗效不佳的可能宿主因素,并探索干扰素功能分类基因芯片在预测干扰素治疗CHB患者疗效中的应用前景。从我院干扰素治疗队列中随机选取有应答CHB患者(Rs)、无应答CHB患者(NRs)各3例,在健康体检者中招募受试者3例,利用IFN功能分类基因芯片检测Peg-IFN-α2a治疗前后CHB患者及健康对
目的:观察积雪益肾排毒方治疗慢性肾脏病的临床疗效,并运用网络药理学方法研究积雪益肾排毒方治疗慢性肾脏病的作用靶点及作用机制。方法1:收集2021年1月-202年12月武汉市中医医院汉口院区肾病科收治的慢性肾脏病患者共82例,按照随机数表法分为观察组和对照组。对照组予以常规对症治疗,包括:营养管理、积极治疗原发病、控制血压血糖、纠正贫血、纠正代谢性酸中毒;观察组在对照组的基础上加用积雪益肾排毒方,治
<正>网点是中国工商银行经营发展的基本单元和作战前线,是全行的核心资源和发展根基。网点兴,则工行兴;网点强,则工行强。为落实工行党委“扬长、补短、固本、强基”战略布局,工商银行大连市分行(以下简称“大连市分行”)在全行树立网点作为“作战前线”的统一认识下,紧紧围绕网点“一体化、生态化、数字化”转型目标,激发网点活力,持续推动大连市分行网点转型与竞争力提升工作再上新台阶。
期刊