【摘 要】
:
随着数字成像系统和深度神经网络相关技术的成熟,基于视觉信息和神经网络的多目标跟踪方法获得了越来越多研究者的关注。密集人群场景下的多目标跟踪是一个具有挑战性的课题,基于检测的多目标跟踪(Tracking by Detection,TBD)相较于不使用检测的多目标跟踪(Detection Free Tracking,DFT)在这一场景下有更好的性能表现。TBD框架使用数据关联算法将检测器提供的目标检测
论文部分内容阅读
随着数字成像系统和深度神经网络相关技术的成熟,基于视觉信息和神经网络的多目标跟踪方法获得了越来越多研究者的关注。密集人群场景下的多目标跟踪是一个具有挑战性的课题,基于检测的多目标跟踪(Tracking by Detection,TBD)相较于不使用检测的多目标跟踪(Detection Free Tracking,DFT)在这一场景下有更好的性能表现。TBD框架使用数据关联算法将检测器提供的目标检测框按照它们对应的ID关联起来,得到多目标跟踪结果。这一过程中的数据关联算法需要考虑到被跟踪目标的各类特征信息,其中运动特征信息对密集人群场景下的多目标跟踪准确度提升很有帮助,而运动特征的提取通常由轨迹预测模型来完成,好的轨迹预测模型能够弥补密集人群场景下检测器的限制,得到更完整更精确的多目标跟踪结果。本文注意到现有的多目标跟踪方法使用到的轨迹预测模型比较简单,且由轨迹预测提取的行人运动特征信息在多目标跟踪的数据关联过程中未被充分利用,无法很好地适应密集人群场景下的多目标跟踪。就行人轨迹预测而言,本文注意到当前流行的轨迹预测方法要么不考虑场景中的静态物体对行人的轨迹影响,要么对静态物体的分类与标注方式仍然比较粗糙且不自动化。根据上述发现和分析,本文提出一种名为双场景特征感知LSTM(DCA-LSTM)的行人轨迹预测网络,该网络能更加智能地提取场景中的特征信息,得到精度更高的行人轨迹预测结果。然后该网络被用到多目标跟踪模型中以提升密集人群场景下的多目标跟踪性能。全文的工作和贡献可以总结为以下几个方面:1)针对环境中静态物体信息的提取方法比较粗糙这一问题,本文提出一种基于数据学习来自动对场景中的静态物体信息进行分类的方法,分类后的信息分别与行人的位置信息进行关联;2)设计出一种DCA-LSTM网络处理关联后的行人-场景特征信息,并得到最终的行人轨迹预测值;3)将DCA-LSTM网络嵌入到在线多目标跟踪模型中,并根据DCA-LSTM网络的预测特性设计出一种与之匹配的目标框动态选取算法,以弥补检测器在密集人群场景下的性能不足,得到更好的多目标跟踪结果。经过和其他方法实验结果的对比,上述工作在行人轨迹预测和密集人群的多目标跟踪两个领域中都获得了具有竞争力的性能指标。
其他文献
近年来,通过计算机视觉的方法对目标物体表面进行三维重建一直是研究热点。本文以市场上常见的激光双目三维成像系统为研究对象,对该系统中涉及的关键技术:立体匹配和点云拼接,展开深入的研究,提出了重建过程中的关键步骤的优化思路,并根据优化的思路方法设计了针对性的实验来验证算法的有效性。具体来说,在立体匹配的激光光条中心提取的阶段,提出了利用方向模板的方法来优化灰度重心法在激光光条走向变化较大时的光条中心提
纳米电介质是一种具有性能可编辑潜力的新型电介质,其通过在聚合物基中均匀填充纳米颗粒可以获得优异的介电特性,被认为是未来最有潜力的电介质材料。然而,纳米填料团聚会导致纳米电介质无法达到预期的性能,甚至导致纳米电介质性能的严重退化。目前,团聚对材料的影响程度很难量化,是一个亟待解决的难题。使用扫描电子显微镜(SEM)拍摄纳米电介质图像并进行处理是一种分析团聚现象的有效手段。然而,受限于该领域图像处理的
叶面积指数(Leaf Area Index,LAI)是衡量植物生长状况的一个重要参数。它也是农业科学、生态科学、遥感科学中众多数学模型的基本参数。叶面积指数(LAI)控制着水、营养和碳循环中的许多生物和物理过程,被定义为单位地表面积的单侧绿叶面积。针对当前主流的LAI间接测量法具有误差大,精度低,稳定性低等缺点。本课题基于摄影法,将计算机视觉技术应用到LAI测量中,开展从单视角顶视法和多视角精确构
视觉定位技术作为移动机器人自主导航的核心技术,在赋能空间位置感知方面有着重要的价值。不对环境做任何限制,只依靠运动目标携带的相机就可实现定位功能的特点,使得视觉定位系统可广泛地应用于国防领域、航空航天领域、工业领域、日常生活等场景。尤其对于卫星信号缺失,有源定位无法部署或大范围覆盖的复杂环境,视觉定位更是凭借应用场景丰富,载体类型不限,成本可控的优点,在工业界和学术界引起了广泛的兴趣。视觉里程计(
航拍图像的目标检测是计算机视觉研究领域的前沿课题之一,在诸如城市土地使用类型分析,交通监测和农作物生长监测等领域都取得了广泛应用。目前应用最广泛的目标检测方法大多都基于深度学习,其中又根据是否使用一系列预先铺设好的锚框(Anchor)分为Anchor-Based和Anchor-Free两种类型,常见的Faster-RCNN、Cascade-RCNN等都属于Anchor-Based一类。最近兴起的A
近年来,移动互联网技术的快速进步和智能设备的广泛普及使得基于位置的社交网络平台得到了空前的发展。位置社交网络可以将虚拟的网络社区和真实的物理世界联系在一起,从而使用户能够通过移动设备将自己喜欢的地点分享到网络上,帮助其他用户发现有趣的地点。因此,向用户推荐感兴趣的地点成为了一个热门的研究方向。兴趣点推荐系统主要是通过用户的历史签到数据来获取用户的出行偏好,以此向用户推荐地点。但现有的关于兴趣点推荐
在实际应用中,情感分析通常是与领域相关的,由于领域之间的语义差异,相同的词在不同领域所表达的情感极性可能是矛盾的。因此,在特定领域训练好的模型,可能无法在另外一个领域很好的运行。另外,领域之间可能存在公共信息,为每个领域都训练单独的情感分类器会显得比较冗余。因此本文的工作以此作为出发点,旨在研究如何充分利用多个领域有限的训练数据来提高所有领域的分类性能。与此同时,本文会聚焦于跨领域文本情感分析场景
随着互联网的飞速发展,网络数据种类和规模极速增长,用户难以发掘出感兴趣的物品。为解决“信息超载”的问题,个性化推荐算法被广泛地研究和使用。数据稀疏程度较高且数据规模较大对推荐算法的准确率和推荐效率提出了挑战。研究高效准确的推荐算法对提升用户使用体验和企业盈利具有重要意义。本文从用户行为角度出发,在协同过滤算法的基础上针对数据稀疏性、推荐系统的可扩展性和近邻搜索的高效性等问题提出了对应的解决方案:1
登机桥在对接舱门后,飞机会随着自身的载重变化发生高度变化,因此登机桥必须工作在自动调平模式以避免和飞机舱门发生碰撞。登机桥通过调平轮上的编码器实现此功能,但该机构会发生假接触,打滑等问题,每次对接完成后都需要桥手进行检查。目前无人驾驶登机桥的研究在替代桥手的同时也引入了新的研究课题,即如何更准确且智能的检测机舱位移。本论文分析基于视觉的无靶标位移测量方法,主要研究了基于稀疏光流和特征点匹配的机舱位
在医疗领域中大量的专业医学知识以文本的形式存储,利用自然语言处理算法对其进行分析处理能够帮助医生减轻工作负担。肺癌领域的前沿趋势预测可以为医生未来研究方向的规划提供参考,抽取医疗文本中的关键信息能够协助医生阅读文献,自动问答系统可以在不增加医生负担的情况下帮助大众查询简单的医疗问题。本文从以上几个需求出发,将自然语言处理技术应用于肺部疾病文本分析中以缓解医疗系统的压力。本文的主要研究工作如下:针对