基于遮挡感知沙漏网络的车辆关键点检测及其应用

来源 :安徽大学 | 被引量 : 0次 | 上传用户:lijing1671
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
车辆关键点检测是表达车辆关键部件位置的一种方法,可以用于提升交通系统视觉任务性能,包括车辆检测、车辆分类和车辆重识别等。因此,车辆关键点检测是计算机视觉领域的一个重要研究课题,但是由于车辆的自身刚性结构以及道路交通的复杂性,导致车辆存在大量遮挡关键点,使得准确检测车辆关键点变得非常困难。本文针对车辆关键点检测中的遮挡问题展开研究,提出遮挡感知沙漏网络,极大提升了关键点检测性能,并将关键点检测应用到车辆重识别框架中,取得了显著的精度提升。本文的主要研究成果可以总结为以下两个方面:提出了一种新型的多类型遮挡感知网络,以对多类型遮挡进行准确地预测,从而实现遮挡感知的车辆关键点检测。现有工作通常通过估计车辆方向实现自遮挡关键点的检测,但车辆方向和其他类型被遮挡的关键点(如被周围物体遮挡)的估计误差将极大地限制车辆关键点检测的性能。为此,本文将车辆关键点分为非遮挡、自遮挡和正常遮挡三类,并设计了遮挡分类子网络来预测所有关键点的遮挡状态。然后,将这些遮挡状态嵌入到一个两阶段的沙漏网络中,实现遮挡感知的关键点检测。该框架不需要估计车辆方向,只要考虑不同类型的遮挡状态,因此减少了其他方法在车辆方向估计上带来的误差,提高车辆关键点检测中遮挡状态的检测精度。在公共Ve Ri-776数据集上的大量实验表明,提出的方法明显优于其他最先进的方法。提出了一种基于车辆关键点嵌入的车辆重识别方法。为了验证本文所提出的车辆关键点检测方法的实用性,本文将其应用于车辆重识别框架中,用于解决车辆重识别任务中严重的视角变化问题。为此,本文使用了区域视觉转化模块,其利用车辆关键点检测结果,将车辆分为不同的区域,将这些区域映射到统一的视角。考虑到不同视角的车辆特性,将它们排列成一个细粒度级别的特征表示,同时利用一种动态批处理困难三元组损失函数来训练网络。此外,车辆的重要特征不仅仅在这些区域上,关键部件同样有益于特征匹配,本文提出在车辆关键点上的细粒度特征进行识别。在两个标准车辆重识别数据集上的大量实验表明了该方法的有效性。
其他文献
骨架是三维模型的一种紧凑的一维表示,可以将三维模型转换为更简单的表示形式。目前的骨架提取方法因为点云提供信息的稀少以及复杂的柔性变化,仍然不够稳定。因此本文研究探讨了非刚性点云间的基于稀疏匹配对的一致性骨架提取技术。首先在现有的单个点云曲线骨架提取技术的基础上提出了一种改进的方法,能够更好的提取出骨架。其次提出一种在多个形状中进行骨架协同提取的方法,使得多个点云具有一致的骨架结构。具体来说,本文主
学位
近年来,由于数据采集技术的快速发展,多视图数据在实际生活中越来越常见。多视图学习就是将多个视图的信息结合起来进行学习的方式,以获得更好的结果。然而噪声、数据采集的故障等许多无法预料的因素导致数据缺失,数据会在单个视图或多个视图中随机缺失,不完整多视图聚类就是对此类有缺失的多视图数据按照一定规则划分成几个簇的过程。以往的常规方法无法直接处理此类数据,因为它们都是在所有视图都没有缺失的的前提下进行学习
学位
聚类作为一种无监督学习,旨在发现一组模式、数据点或对象的自然分组。在聚类算法中,一个重要的问题是缺乏一种确定性的方法,用户可以根据该方法来决定哪种聚类方法最匹配给定的输入数据集。聚类集成作为一种知识重用,为解决聚类固有的挑战提供了一种解决方案。它试图在不访问数据原始特征的情况下,通过组合基本聚类算法得到的计算解来探索高稳定性和鲁棒性的结果。在面对聚类分析问题时,聚类集成已被证明是一种很好的选择。然
学位
一直以来,图像识别技术在学术界和工业界都备受关注,尤其在机器学习的快速发展下已经取得了令人瞩目的成绩。但是传统的图像识别技术存在亟待突破的问题,例如它们需要大量的有标注的数据去学习鲁棒的识别模型,并且只能识别出训练集中出现的类别图像。如果某个类没有出现在训练集中,在测试时将无法正确识别该类的图像。然而,在真实的应用场景中,经常需要识别没有见过的类别的图像。尤其是在当下的大千世界里,每天都有源源不断
学位
随着信息科技和网络技术的迅速发展,社交网络平台日益增多且迅速扩充,人们之间沟通和交流方式发生巨大的变化。社交网络中的意见领袖在信息传播过程中起着重要的作用,在商品营销、引导舆论走向、促进政策的宣传等方面具有重要的应用。同样,在社交网络分析中意见领袖节点通常被选作聚类任务的中心节点、影响力传播的种子节点进行研究。因此,挖掘意见领袖用户具有重要的实际价值和研究价值。目前,意见领袖挖掘从单一网络结构出发
学位
传统的推荐方法大多局限于单个领域的推荐。单领域推荐面临着推荐系统中固有的的稀疏性问题,因为在数据十分稀疏的情况下,模型很难获得很好的推荐性能。因此,提出了跨领域的思路。然而,现有的大多数跨域推荐模型只使用了两个域的评分信息,不适用于这些域之间没有重叠用户或项目的场景。另外,如果将辅助域中与目标域无关的信息迁移到目标域中,则可能会引起负迁移问题。基于此,本文提出了两种基于跨领域推荐的方法。一种是基于
学位
近几年来,深度卷积神经网络被广泛地应用于解决各种计算机视觉问题,并且在图像分类、目标检测和语义分割等多个任务中展现了非常好的性能,遥感图像路网提取也依托于深度学习这项技术并取得了新的突破。常规的图像大多以地面为参照系,图像中物体的方向是确定的,而遥感图像是从遥远的空中获取的,图像中的物体具有各个朝向,并且由于长距离的拍摄,图像中的目标通常会很小。遥感图像中的道路蜿蜒曲折,交错纵横,具有道路尺度不均
学位
糖尿病性视网膜病变(Diabetic Retinopathy,DR)是一种与长期糖尿病相关的眼部疾病,有着发病率高、危害性大、初期症状不明显的特点。如果在患病早期能够做出及时的诊断,可以有效地减缓患者视力损害的进展以避免失明。然而,检测DR需要训练有素的临床医生耗费大量时间仔细检查和评估患者视网膜的数字彩色眼底照片,这无疑增大了病情诊断的难度。近年来,由于深度学习在图像分类和目标检测等领域取得的巨
学位
深度学习技术在智能物流配送系统中已经得到了广泛的使用,例如通过目标检测实现对货物的识别和分类,通过人脸识别完成对收货人的确认,和通过自然语言处理实现与收货人的实时交互等。这些智能应用在计算能力和电池容量有限的终端设备上执行,会导致响应时延和能耗较高,无法满足用户的实时性要求。现有的基于云计算环境架构的智能系统也面临着带宽不足、网络波动等问题,服务响应时延过高。此类问题严重影响到智能物流配送系统的稳
学位
基于STEM教育理念,文章以电与磁的教学为例,从五个维度阐述STEM理念下的教学模式,基于真实情境,给学生更多学科融合的学习机会,发展学生的问题解决能力、实践能力和创造思维,并为该课堂模式提供开发思路和教学思考。
期刊