【摘 要】
:
由于光照、色调等因素的干扰,采集自不同摄像头的同一个行人的图像通常存在视觉差异,而不同行人的图像却可能很相似,因此往往很难用线性模型来区分它们。我们通过对传统的只能用于单视图场景的协同表示分类器(CRC)进行跨视图非线性扩展,提出跨视图核协同表示分类(CV-KCRC)框架并将之应用于行人重识别。CV-KCRC不仅能增强CRC处理跨视图异类样本线性难分问题的能力,而且还能提升了模型的判别力和鲁棒性。
论文部分内容阅读
由于光照、色调等因素的干扰,采集自不同摄像头的同一个行人的图像通常存在视觉差异,而不同行人的图像却可能很相似,因此往往很难用线性模型来区分它们。我们通过对传统的只能用于单视图场景的协同表示分类器(CRC)进行跨视图非线性扩展,提出跨视图核协同表示分类(CV-KCRC)框架并将之应用于行人重识别。CV-KCRC不仅能增强CRC处理跨视图异类样本线性难分问题的能力,而且还能提升了模型的判别力和鲁棒性。此外,考虑到由拍摄角度和行人姿势差异所造成的图像之间彼此局部错位的问题,同时弥补CV-KCRC只能对图像进行全局匹配的不足,我们提出跨视图局部块度量学习(XLBML)算法。XLBML通过图匹配算法实现在语义最相关的块之间学习跨视图局部块判别子空间和局部块距离度量,它在缩小正样本对相关局部块之间距离的同时扩大负样本对相关局部块之间的距离,最终获得局部块距离度量函数用以精准匹配跨视图样本。本文的主要研究内容如下:(1)将传统的CRC扩展到跨视图场景,同时引入非线性映射,使其能处理跨视图样本的同向分布问题。然后再在高维非线性特征空间中学习一个跨视图鲁棒的低维判别子空间,最后对其中的样本进行协同表示,从而获得跨视图一致的样本协同表示编码。(2)通过图匹配对齐正样本对之间的语义相关局部块。然后利用块相关性矩阵指导局部块度量函数的学习过程,从而实现在最相关的局部块之间学习跨视图局部块判别子空间和距离度量函数,进而可以更精确地缩小正样本对相关局部块之间的距离,同时扩大负样本对相关局部块之间的距离,最终获得鲁棒的跨视图局部块度量函数。最后集成CV-KCRC全局距离和局部块距离作为最终的匹配依据,用以克服全局和局部模型各自的局限性,提升整体模型的鲁棒性。(3)在一些常用的行人重识别数据集上进行试验,结果验证了所提出的算法是有效的并且性能优于文中所列举的相关算法。
其他文献
腺癌是一种常发生于上皮腺体组织的癌症类型,在结直肠癌、前列腺癌、乳腺癌、肺癌等多种恶性肿瘤中都十分常见。在病理形态上,腺癌的发生往往伴随着腺体结构分化变差甚至不分化,即腺体组织呈现出异常变形扭曲、内部空腔结构被细胞核侵占致其缩小甚至消失。这种不同程度的腺体分化直接与腺癌的恶性程度相关联。因此,在临床病理诊断中,腺体组织结构的分化程度是病理学家确定腺癌等级乃至决策治疗方案的决定性因素。为了实现腺癌恶
2D人体姿态估计的研究目标是准确检测并定位图片中人体的所有关键点,例如,膝盖,脚踝等,是当前计算机视觉领域的一个研究热点。近年来,尽管基于深度学习的人体姿态估计模型取得了较大进展,但大多数工作均聚焦于人体关键点的检测,忽视了肢体之间的关联。鉴于人体物理结构的整体性质,本文从关键点的相关性来建模学习人体姿态估计特征,主要研究工作如下:(1)提出基于期望最大化的人体姿态估计网络(Expectation
乳腺癌是女性发病率和死亡率最高的恶性肿瘤,新辅助化疗是治疗乳腺癌的有效手段,有利于缩小肿瘤、降低肿瘤分期,将无法手术的肿瘤转化成可手术的肿瘤,提高患者无病生存率。临床医生根据自身经验以及患者的分子分型预估患者是否需要进行新辅助化疗,主观性较强且无法针对单一患者准确预测其化疗后的病理缓解程度,易导致化疗无效后患者错过最佳治疗时机。因此,本文旨在利用计算机图像处理技术对乳腺癌患者新辅助化疗前的全景穿刺
图像复原技术随着数字技术的发展,已被广泛应用于多个领域,是图像处理领域中一个重要的研究方向。传统图像复原方法如逆滤波法、维纳滤波法、最小二乘法等难以解决函数逼近问题,难以应用于复杂场景。本文主要使用生成对抗网络实现图像超分辨率重建和图像修复两方面的复原任务。图像超分辨率重建在预处理时会出现丢失部分图像重要的高频细节,重建图像过于光滑以及网络模型训练不稳定等问题。图像修复过程中存在受伪像影响、修复结
视觉目标跟踪(Visual Object Tracking)旨在对视频任意目标进行轨迹追踪,是计算机视觉领域中基础研究方向。目标跟踪技术在自动驾驶、机器视觉、智能监控、军事国防等领域得到了广泛应用。深度学习技术的发展大幅提高了目标跟踪算法的性能,但在应对相似目标干扰、非刚性形变、尺度变化剧烈挑战时,依然存在鲁棒性差、准确性低的难题,无法满足实际应用场景的需求。本文基于深度学习技术,提出两种基于多任
自动调制分类(Automatic Modulation Classification,AMC)是信号解调前一个复杂且重要的技术,它在军事领域和民用领域都有广泛的应用。近年来,由于机器学习算法的引入,使得AMC技术备受关注。基于机器学习的AMC算法相比于传统算法有更高的识别精度和鲁棒性。本文深入研究并做了以下几方面的工作:1.针对复杂信道情况下,由于调制信号受噪声干扰导致识别准确率不高的问题,提出基
正确判断脑部神经胶质瘤基因型是突变还是野生类型,将有助于医生做出正确的预后治疗。针对活体组织检查会对患者造成一定的伤害、人工观察核磁共振图像准确率低的情况,本文借助计算机辅助的方式对神经胶质瘤进行判断。本文以神经胶质瘤分型为目的,多序列核磁共振图像为数据基础,深度学习为方法,从预处理到肿瘤分型分别提出了不同的深度学习网络结构。本文的创新性工作包括以下内容:(1)针对预处理时,3D Slicer等软
第五代(The Fifth Generation,5G)通信系统采用更先进的通信技术对5G信道建模提出了更高的要求。在无线信道建模的研究领域中,最大的挑战是建立有效且准确的信道模型,能够模拟影响无线通信系统性能分析的所有传播特性。车对车(Vehicle-to-Vehicle,V2V)信道建模作为5G信道建模研究的热点之一,越来越受到研究人员的关注。在V2V通信场景中,发送端(Transmitter
随着物联网的迅速发展,射频能量采集技术的应用范围也逐步扩大。作为射频能量采集系统中的能量接收和转换器件,整流天线在系统中发挥着重要的作用。整流天线的一个研究方向是在有限的功率密度环境下尽可能地吸收更多能量以提高能量转换效率。实际的能量采集过程中,天线的辐射方向、极化方式以及与整流电路的合并方式等都制约着能量采集系统的接收能力。本文设计了极化可重构全向圆极化天线,通过切换极化方式在辐射范围内提高天线
随着图像处理技术的发展和嵌入式硬件的进步,基于机器视觉的无人机着陆已经成为非常热门的研究领域。无人机视觉着陆控制是无人机飞行控制系统的关键技术之一,它对无人机着陆的稳定性,准确性,可靠性和实时性能有很高的要求。基于视觉的着陆系统是学者们研究的热点,与传统的系统相比,该系统具有成本低、抗干扰能力强的优点。实现无人机视觉着陆的基本要求是获取无人机所处环境的信息并通过该信息准确估计无人机的位姿姿态,其中