【摘 要】
:
人体目标再识别是计算机视觉和智能监控领域的重点研究课题之一,其任务是匹配无重叠视域的摄像机在不同时间、地点拍摄的人体目标。受光照条件、背景、遮挡、视角和姿态等因素影响,不同摄像机下的同一目标表观差异较大。目前研究主要集中在特征表示和度量学习两方面:一方面,研究者们致力于提出区分度高、鲁棒性强的特征描述子;另一方面,很多度量学习方法在人体目标再识别问题上了取得了较好的效果。但对于多样化的数据集,单一
论文部分内容阅读
人体目标再识别是计算机视觉和智能监控领域的重点研究课题之一,其任务是匹配无重叠视域的摄像机在不同时间、地点拍摄的人体目标。受光照条件、背景、遮挡、视角和姿态等因素影响,不同摄像机下的同一目标表观差异较大。目前研究主要集中在特征表示和度量学习两方面:一方面,研究者们致力于提出区分度高、鲁棒性强的特征描述子;另一方面,很多度量学习方法在人体目标再识别问题上了取得了较好的效果。但对于多样化的数据集,单一的全局度量很难适应差异化的特征。有研究者提出了局部度量学习思想,但由于再识别问题本身的研究挑战,现有的局部度量学习方法无法直接应用于该问题。本文以提高在多样化数据集上的再识别准确率为出发点,利用局部度量学习思想,结合现有的全局度量学习算法,提出一系列多度量学习方法,有效提高了再识别的性能,具有广泛的应用价值。具体包括以下几项研究工作:1)提出基于高斯混合模型和半正定约束的多度量学习方法。将度量矩阵约束为半正定矩阵,以最小化训练集的对数逻辑损失函数为目标。使用高斯混合模型拟合训练样本分布,并利用样本在各个高斯成分下的后验概率,改进目标损失函数中不同样本的损失权重,每个高斯成分对应不同的优化目标,对多个目标函数分别使用加速近端梯度法进行迭代优化,学习多个度量矩阵,以此计算多个相似性距离,并将多个距离加权结合。2)有效地将局部度量学习方法应用到再识别问题,提出以聚类间存在样本重叠的子集划分方式进行局部训练集划分,有效克服了局部度量学习方法在人体目标再识别问题中的应用困难。3)利用局部度量学习思想,结合近几年提出的交叉视角二次判别分析(Cross-view Quadratic Discriminant Analysis,XQDA)和加速近端梯度度量学习(Metric Learning by Accelerated Proximal Gradient,MLAPG)等全局度量学习方法,提出一种整合全局-局部度量学习框架。利用高斯混合模型对训练样本进行聚类,并使用2)中提出策略划分局部训练子集,在每个局部子集内分别进行局部度量学习;同时在整个训练集上进行全局度量学习。对于测试样本,根据样本在高斯混合模型各成分下的后验概率,将局部和全局度量矩阵加权结合,做为衡量样本相似性的依据。在VIPeR、PRID 450S和Market-1501等数据集上的实验结果验证了本文提出的基于高斯混合模型的多度量学习、局部度量学习和整合全局-局部度量学习方法的有效性。在包含丰富的背景和人物衣着变化的VIPeR数据集上的匹配准确率达到42.0%以上,相比于XQDA和MLAPG等全局方法,提高2.0%以上,在其它数据集上的性能也有不同程度的提高,本文提出的方法的性能普遍优于或接近现研究阶段的主流方法。另外,在使用不同的特征表示条件下,提出的整合全局-局部度量学习框架均可对全局度量学习方法做出改进,该方法具有广泛的应用价值。
其他文献
本文主要研究了基于分数阶微积分的图像增强和图像降噪两个方面的内容。在图像增强方面,通过对适型分数阶导数的离散化构造了一种新的分数阶微分掩模,得到了一个新的自适应分数阶微分掩模算法用于图像增强。对于图像降噪,提出了一种新的基于适型分数阶积分的自适应分数阶积分掩模降噪算法,并通过几个图像处理效果参数给出了处理后的图像质量对比。根据内容,全文共五章:第一章,介绍了分数阶图像处理的课题来源、研究发展概述、
在油气储层相建模过程中,准确表征和再现地质露头或地质知识库中沉积相或岩相展现出的空间结构特征极为关键,可用的方法主要包括基于区域化变量理论的传统地质统计学建模(如截断高斯和序贯指示建模)、基于目标的建模方法(河道模拟)、基于相转移概率的建模方法及近年来兴起的多点地质统计方法。但是,如何评价相建模方法的适用性及其对数据空间结构特征恢复的有效性始终是相建模过程中较为薄弱的环节。提出利用马尔可夫链模型评
作为一种新的广告交易形式,在线广告交易所在近期被多家商业公司引入。该种广告交易方式要求各广告网络(ad networks)为每次页面浏览进行实时自动竞价。交易Agent竞赛之广告交易所(TAC AdX)是一个要求参与者扮演广告网络,在广告交易所中自动竞买广告计划(advertising campaign)和广告展现(impression)的竞赛,其主要特殊点在于存在长期信誉度。本文从第一届TAC
隐式篇章关系识别是自然语言处理中极具挑战性的一项任务,其旨在自动识别缺少连接词的两个论元(子句或者句子)之间的语义关系(例如因果,并列等)。近些年,随着深度学习在自然语言处理各类任务中的广泛应用,也出现了众多基于深度学习的隐式篇章关系识别模型,取得了较好的效果,已经全面超过了早期基于人工提取特征的方法。现有基于深度学习的方法可大致归为以下三类:1)基于论元编码的方法,先通过神经网络模型学习两个论元
数据可视化是一类利用图形图表等直观的展示方法分析数据中隐含的信息的数据分析方法。动态图是一种可视化模型,它对随时间变化的数据进行抽象。针对动态图的可视化研究是可视化的动态展示方法研究的一个重要方面。针对动态图可视化的研究有很多成果,重点是如何对于数据的时间信息进行有效展示。针对数据的时间信息的展示有两种思路,即时间的静态化展示以及动态展示。其中,前者主要利用时间轴以及空间并排的视图,后者主要通过动
在激烈的国际税收竞争背景下,跨国企业激进地税务筹划导致各国税基侵蚀与利润转移加剧。无形资产成本分摊协议本应为企业无形资产的规范管理和风险防控发挥积极效果,但实际上被跨国企业用来作为利润转移的避税工具,成本分摊协议方式开发无形资产使得跨国间转让定价的避税防控变得更加艰巨,也日益收到各国税务机关的关注。在数字经济背景下技术手段成熟的同时,仍未有效解决无形资产估价难题,反而带来更为复杂的无形资产转让定价
机载测向技术一直以来在军事和民用领域发挥着重要的作用,在军事上可用于情报侦察,在民用上可用于频谱检测、无线电监测和海事救援等等。近年来,微型旋翼无人机的发展迅速,其
本论文通过对松辽盆地中央古隆起的岩石特征与储层特征进行观察和鉴定,结合相关地质资料,预测中央古隆起是否具有发育优势基岩油气储层的良好潜力。在撰写论文过程中,共观察鉴定基岩岩石普通薄片和铸体薄片200多张,鉴定岩石岩性二十多种,不仅有变质和浅变质岩类,还有蚀变岩以及少量未发生变质作用的火山碎屑岩和沉积岩,这表明中央古隆起区发生的变质作用不均一,除了区域变质作用外,还可能叠加发生了热变质作用、动力变质
随着互联网的日益普及和网页技术的迅猛发展,人们在享受网页信息带来的便捷的同时,异常网页攻击也在无孔不入地侵蚀着人们的隐私和财产安全。近些年来,异常网页的破坏力越来越大,隐蔽性越来越强,方式也越来越多样化,而对于异常网页的识别也变得越来越难。普通用户往往很难判断网页是否存在异常,现有的Web异常检测方法往往也不能很好地检测出多种类型的异常网页和新型的异常网页,特征提取是检测异常网页的一个关键步骤。本
词汇是语言学习中的一个重要环节,扮演着不可或缺的重要角色。虽然随着语料库的发展,国内有关语块理论的实证研究也越来越多,为词汇的教学提供了很多建议,对于新疆大多数高中生来说,尤其是高一的学生,词汇的记忆和学习仍然是一大难题。即使很多学生在初中时英语学习很好,但慢慢随着英语词汇量的增加,新课改后单词量大,高中学习时间紧迫,大量的词汇任务由学生课后独自完成,使学生对英语学习的兴趣降低,从而导致成绩的下滑